小红花·文摘

最佳网页抓取浏览器 | 利用无头AI智能提取数据

DEV Community ·

本研究提出了SCP-116K数据集，包含116,756对高质量题-解，旨在解决高等教育科学领域缺乏优质数据集的问题。该数据集通过高效的自动提取管道，确保材料的科学性和教育水平，促进科学推理研究和高级科学推理任务的发展。

SCP-116K：一个高质量的题-解数据集及其在高等教育科学领域的自动提取通用管道

BriefGPT - AI 论文速递 ·

本研究探讨了海洋终止冰川崩裂前沿位置的变化，并提出利用深度学习系统从合成孔径雷达图像中自动提取该位置。研究发现，深度学习系统与人类观察者的表现存在显著差距，需进一步研究以实现完全自动化监测。

比较研究：利用深度学习在合成孔径雷达图像中 delineation 冰川崩裂前沿

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的基于图的框架，能够从未校准的多视角图像中自动提取语义对象并生成二维地图，解决了手动标注效率低和准确性差的问题。在强视角变化下，该方法仍能保持4米以内的平均精度。

Maps from Motion (MfM): Generating 2D Semantic Maps from Sparse Multi-view Images

BriefGPT - AI 论文速递 ·

本研究旨在提高维基数据中学术数据的可获取性，填补会议数据的不足。通过大型语言模型自动提取会议元数据并进行人工验证，提出了一种新方法，扩展了维基数据中的学术实体，增强了其作为学术资源的实用性。

Scholarly Wikidata: Population and Exploration of Conference Data in Wikidata using Large Language Models

BriefGPT - AI 论文速递 ·

Contri.Buzz - 庆祝你的开源贡献者

DEV Community ·

本文介绍了一种自动提取无机化合物实验合成信息的系统，评估了无监督和有监督模型的效果。通过多模态模型结合图形和自然语言，提升了分子知识的提取能力。研究展示了大型语言模型在材料属性预测和信息提取中的应用，强调了其在材料科学中的潜力与挑战。LLaMP框架能够动态整合材料科学数据，推动未来自主实验室的发展。

利用化学基础模型促进在多智能体工作流中针对结构的检索增强生成，以支持催化剂和材料设计

BriefGPT - AI 论文速递 ·

本文探讨了利用遥感技术和深度卷积神经网络分析城市土地利用模式，重点改进建筑物检测和提取方法。研究中采用多种卷积神经网络架构，在高分辨率卫星图像和复杂数据集上取得了良好性能，推动了建筑物自动提取和城市区域土地覆盖图的生成。

自动化国家城市地图提取

BriefGPT - AI 论文速递 ·

该研究旨在创建自动提取俄语科技文本的工具，并提供跨领域的俄文科技文本数据集。研究者使用经过细调的多语言BERT模型提出了基准算法，用于方面提取。该模型即使在有限数量的科技领域进行了训练，也能够推广到新的领域。

FLARE 2022 Challenge是一个腹部器官分析挑战，旨在评估AI算法的快速、低资源、准确、注释高效和泛化能力强。该挑战从50多个医疗团体构建了一个跨洲际和跨国家的数据集，包括来自不同种族、疾病、阶段和制造商的计算机断层扫描。独立验证了一组AI算法通过使用50个标记扫描和2000个未标记扫描实现了90.0%的中位数Dice相似系数（DSC），并成功泛化到保留的外部验证集。该算法还实现了关键器官生物学特征的自动提取，这在传统的手动测量中需要耗费大量人力。