小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Agent设计模式——第 21 章:探索和发现

本章探讨智能代理在复杂环境中主动探索新信息和未知因素的重要性。通过多代理框架,代理能够生成假设、设计实验并推动创新,从而提高科学研究的效率。

Agent设计模式——第 21 章:探索和发现

XINDOO的博客
XINDOO的博客 · 2025-10-04T16:00:09Z

本研究探讨大型语言模型在生物医学假设生成中的可靠性,重点评估假设的真实性和幻觉现象。提出了TruthHypo基准和KnowHD检测器,以系统评估模型生成假设的准确性。研究发现,LLMs在生成真实假设方面存在挑战,但KnowHD能够有效过滤真实假设,促进科学发现。

Toward Reliable Biomedical Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z
NEXA-MOE:一种高效强大的AI,用于在资源紧张的情况下进行科学发现

NEXA-MOE是一种高效的混合专家模型,参数仅1.1亿,能够在物理、生物和材料科学领域进行假设生成和方法设计。其模块化架构通过智能路由优化资源使用,在有限硬件上实现卓越性能,展示了在资源受限环境中构建高效AI系统的可能性。

NEXA-MOE:一种高效强大的AI,用于在资源紧张的情况下进行科学发现

DEV Community
DEV Community · 2025-05-12T04:00:00Z

本研究提出了IRIS互动研究构思系统,通过人机互动与蒙特卡洛树搜索等方法,提升研究人员生成新假设的控制力和洞察力,显著增强研究构思效果。

IRIS:加速科学发现的互动研究构思系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本文探讨了假设生成的关键问题,提出了HypoBench基准以评估大语言模型的假设生成能力。研究发现,现有方法能够识别有效模式,但在合成数据集上的表现仍需改进,为人工智能在科学发现中的应用提供了资源。

HypoBench:系统化和原则性的假设生成基准评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

该研究提出了MicroVQA基准,评估科学研究中专家的图像理解和假设生成能力。通过1042道多项选择题,揭示了现有语言模型在多模态推理中的不足,强调感知错误是主要挑战,为AI驱动的生物医学研究提供了重要资源。

MicroVQA:基于显微镜的科学研究多模态推理基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
谷歌推出AI共同科学家系统以助力科学研究

谷歌推出AI共同科学家系统,旨在协助科学家生成假设和研究提案。该系统基于Gemini 2.0,模拟科学方法,促进人机合作。已在生物医学领域测试,显示潜力,但需改进文献审查和事实核查。社区反应不一,部分人赞赏其加速研究能力,另一些人质疑其创新性。谷歌邀请研究机构参与测试计划,以评估系统优缺点。

谷歌推出AI共同科学家系统以助力科学研究

InfoQ
InfoQ · 2025-03-12T10:11:00Z
Can LLMs Independently Discover Scientific Hypotheses Published in Nature? In-Depth Analysis of the ICLR 2025 Paper MOOSE-Chem

MOOSE-Chem研究表明,大语言模型(LLMs)能够在化学领域自动发现新假设,并重新发现已发表的顶级假设。该框架结合文献检索、假设生成和排序,利用认知科学理论,提高假设质量,促进科学发现。

Can LLMs Independently Discover Scientific Hypotheses Published in Nature? In-Depth Analysis of the ICLR 2025 Paper MOOSE-Chem

机器之心
机器之心 · 2025-02-06T03:58:00Z

本研究提出了一种新方法,将文献洞察与数据结合,利用大型语言模型生成假设,实验证明其优于传统方法,并提高了人类判断的准确率,为假设生成提供了新框架。

文献与数据结合:假设生成的协同方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

通过收集50篇社会科学顶级期刊最新发表的论文构建了一个自然语言处理数据集,旨在开发一个系统,能够仅凭原始网页文集生成有效、新颖且对社会科学研究人员有帮助的假设。该框架在GPT-4和社会科学专家评估方面表现出较高的性能。

自动化开放领域科学假设发现的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码