标签

 llm 

相关的文章:

本列表汇集了关于LLM技术的最新研究与应用,涵盖性能优化、问答代理、安全性、基准测试等多个领域,助力您深入了解大模型的前沿动态。

当你告诉大语言模型(LLM) 旁边有一部智能手机时,会发生什么?

告诉大语言模型(LLM)一个环境条件(比如附近有电话)会影响它的表现吗,即使大语言模型(LLM)显然没有电话?这个问题将这些看似毫不相关的研究联系起来,并构成了我的实验基础。

研究表明,智能手机的存在会影响人类智商测试的表现,而对大语言模型(LLM)的暗示可能提升其表现。实验发现,假装有手机在旁时,LLM的输出准确性显著提高,揭示了环境线索对认知的潜在影响。

原文中文,约3400字,阅读约需9分钟。发表于:
阅读原文

迈向科学智能:基于LLM的科学代理的调查

本研究针对科学研究日益复杂所带来的数据管理、跨学科合作及加速发现的需求,探讨了基于大型语言模型(LLM)的科学代理。研究重点在于这些专门代理如何整合领域知识和工具,以提高研究效率和可重复性,同时提供全面的架构、设计和应用评估。研究结果有助于推动科学发现的发展,为科学界提供了有效且可靠的工具。

本研究探讨了利用大型语言模型的科学代理,以提升研究效率和可重复性,整合领域知识与工具,促进科学发现。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

我只用100行代码构建了一个LLM框架——这是我的原因

Have you ever stared at a complex AI framework and wondered, "Does it really need to be this complicated?" After a year of struggling with bloated frameworks, I decided to strip away anything...

Pocket Flow是一个简约的LLM框架,仅需100行代码,旨在简化智能代理的构建,避免复杂性和供应商锁定。它支持灵活定制和高效的AI应用开发,强调透明逻辑和完全控制,适合开发者构建多种应用。

我只用100行代码构建了一个LLM框架——这是我的原因
原文英文,约1600词,阅读约需6分钟。发表于:
阅读原文

FeRG-LLM:通过推理生成的大型语言模型进行特征工程

该研究解决了机器学习中表格数据特征工程的复杂性问题,这是一个依赖于人类专业知识和深厚领域知识的劳动密集型任务。论文提出了一种新颖的框架FeRG-LLM,利用大型语言模型自动执行特征工程,展示了其出色的思维链能力,并通过对话细化模型,从而在多个数据集上实现优于传统模型的表现。此工作不仅提高了特征生成的效率和效果,还能够在本地部署,解决了安全性和成本控制问题。

该研究提出了FeRG-LLM框架,利用大型语言模型自动化表格数据特征工程,提升效率与效果,且在多个数据集上优于传统模型,同时解决了安全性和成本问题。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

超越推测:测量多语言虚假信息中LLM生成文本的增长

本研究解决了对大型语言模型(LLM)生成文本在多语言虚假信息中日益增加的影响的担忧。通过提供首个实证证据,揭示自ChatGPT发布以来机器生成内容的增长及其在不同语言、平台和时间段的模式,从而填补了学术讨论的空白。研究表明,LLM生成文本在虚假信息中的存在正日益显著,对信息生态系统提出新的挑战。

发表于:
阅读原文

什么是大型语言模型(LLM)?

A large language model (LLM) is a type of machine learning model designed for natural language processing tasks such as language generation. LLMs are language models with many parameters, and are...

大型语言模型(LLM)是用于自然语言处理的自监督学习机器学习模型,最强大的形式是生成预训练变换器(GPT)。这些模型能够理解语言的语法和语义,但也会继承训练数据中的偏差和不准确性。自2017年以来,LLM逐渐发展为能够处理图像和音频等多模态模型。

什么是大型语言模型(LLM)?
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文

性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agent,改善治疗开发

Google DeepMind发布了TxGemma,这是一组开源模型,旨在提高治疗开发效率。该模型基于Gemma,经过专门训练,能够理解和预测治疗实体属性,从而缩短实验室到临床的时间并降低成本。TxGemma在多个任务中表现优异,适合数据有限的应用,并具备对话功能,支持科学讨论。研究人员可以根据自身数据微调模型,以提升新疗法的安全性和有效性。

性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agent,改善治疗开发
原文中文,约2400字,阅读约需6分钟。发表于:
阅读原文

CoSIL:基于LLM驱动的代码库图搜索的软件问题定位

本研究解决了现有软件问题定位方法在上下文窗口长度限制下,如何平衡简明有效的上下文与充分全面的搜索空间之间的挑战。提出的CoSIL方法利用模块调用图动态构建调用图,显著提高了问题定位的成功率,相较于现有方法提升了8.6%至98.2%。此外,CoSIL在指导补丁生成阶段时,修复率进一步提升了9.3%至31.5%。

发表于:
阅读原文
发表于:
阅读原文

GateLens:增强推理的汽车软件发布分析 LLM 代理

本研究针对在汽车系统等安全关键领域中,软件发布决策的可靠性和有效性不足的问题,提出了一种新的分析工具 GateLens。GateLens 通过将自然语言查询转换为关系代数表达式,生成优化的 Python 代码,显著提高了分析效率和准确性,减少了超过80%的分析时间,并在复杂查询中展现了更强的鲁棒性。这项工作不仅提升了软件发布的决策质量,同时也为将 AI 集成到关键工作流程提供了实践指导。

本研究提出了分析工具GateLens,旨在提高汽车系统等安全关键领域软件发布决策的可靠性与有效性。GateLens通过将自然语言查询转化为关系代数表达式,生成优化的Python代码,显著提升分析效率,减少80%以上的时间,并增强复杂查询的鲁棒性,为软件发布决策质量和AI集成提供了实践指导。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文