标签

 llm 

相关的文章:

这是一个关于LLM相关研究的文章列表,包括LLM在不同领域的应用和研究成果。这些文章涵盖了LLM在民事诉讼程序、化学、临床文本纠正、语言 - 分子翻译、罗马尼亚语、词汇听觉神经解码、心理测量分析、检索增强、多模态与协同升级混合专家等方面的应用。

LLM Handbook: Strategies and Techniques for Practitioners

原文英文,约1200词,阅读约需5分钟。发表于:

How good are LLMs? Are we ready to trust and use them confidently in our workflows?

大型语言模型(LLMs)改变了机器与人类的互动方式,可以生成类似人类回应的内容,用于生成摘要、解释和回答问题。LLMs还可帮助生成和调试代码,解释复杂算法。然而,使用LLMs需注意模型偏见、滥用和伦理问题。应将其视为提高效率的工具,需从多个来源获取信息并交叉验证。使用LLMs需进行多次实验和迭代,选择适合业务需求的工具或平台。需考虑模型大小、安全性、隐私风险和准确提问。使用LLMs需以业务为先,注意伦理问题,并进行实验和验证,确保负责任使用。

LLM Handbook: Strategies and Techniques for Practitioners
相关推荐 去reddit讨论

LLM Inference on Amazon EKS

原文约24100字,阅读约需58分钟。发表于:

LLM on AWS EKS 方案主要关注客户在自有账号部署大语言模型的需求,基于云原生 K8S 的解决方案,兼具了大语言模型推理的功能完备性、服务的扩展性和应用层面的可观测性等,帮助客户快速打造大语言模型在 AWS 平台上的推理能力。

大语言模型(LLM)是一种基于深度学习技术训练的人工智能模型,具备强大的自然语言理解和生成能力。为解决LLM在自有环境中的部署和运行挑战,提出了基于AWS云原生服务的解决方案,提供生产级别的LLM推理环境,具备扩展性、可观测性和存储管理能力。

LLM Inference on Amazon EKS
相关推荐 去reddit讨论

面向AI的开发:从大模型(LLM)、检索增强生成(RAG)到智能体(Agent)的应用

原文约21200字,阅读约需51分钟。发表于:

通过上一章的介绍,你可以发现OpenAI已经大规模使用工程化的技术使用户能够基于自己的知识库对其GTP系列大模型进行“增强”,从而实现更加垂直化、个性化的能力。那么,如果你基于成本或安全的考虑,想在私域进行自有知识库的“增强”,甚至切换成其它的大模型来使用这个“增强”,就不得不考虑自行开发实现了,这时候就需要了解检索增强生成(RAG)概念和向量数据库技术的应用。检索增强生成(RAG)技术人工智能的应用方法,它通过结合传统的信息检索技术与最新的生成式深度学习模型,来提升信息的准确性和相关性。

未来的人工智能系统将具备更强的自适应学习能力,并能在物理世界中执行任务和作出反应。AI伦理问题将受到挑战,需要建立人工智能治理框架和监管技术。软件开发者角色可能会演变,开发者将更多地承担监督和管理的职能。软件开发行业可能会民主化,更多没有传统技能的人也可以参与软件开发。

相关推荐 去reddit讨论

Optimizing Databricks LLM Pipelines with DSPy

原文英文,约1400词,阅读约需6分钟。发表于:

If you’ve been following the world of industry-grade LLM technology for the last year, you’ve likely observed a plethora of frameworks and tools...

研究人员发布了DSPy,一个将声明性语言模型调用编译为自我改进管道的库。JetBlue使用DSPy构建了自定义的多工具LLM代理,实现了创新的LLM解决方案。DSPy的能力与Databricks的LLM-as-a-judge功能相辅相成。JetBlue借助Databricks和DSPy的力量,能够大规模部署更好的LLM解决方案,并推动可能性的扩展。

Optimizing Databricks LLM Pipelines with DSPy
相关推荐 去reddit讨论

LLM 能更好地解决更长的数学应用题吗?

原文约300字,阅读约需1分钟。发表于:

本研究探索了大型语言模型(LLMs)解决长篇数学问题的能力,引入了扩展的小学数学(E-GSM)问题集并提出了新的度量方法,旨在改善 LLMs 在解决这类问题上的表现。研究结果表明,所提出的方法不仅在 E-GSM 上取得了改善,还具有一定的推广性,为将 LLMs 应用于复杂的现实应用提供了实际解决方案,并为模型广泛性和训练方法的进一步探索开辟了新的途径。

本研究探索了大型语言模型(LLMs)解决长篇数学问题的能力,并提出了新的度量方法,改善了LLMs在解决这类问题上的表现。研究结果表明,该方法不仅在小学数学问题上取得了改善,还为将LLMs应用于复杂的现实应用提供了实际解决方案。

相关推荐 去reddit讨论

从角色扮演到戏剧互动:一种 LLM 解决方案

原文约400字,阅读约需1分钟。发表于:

介绍了一种以 LLM 为基础的交互式戏剧形式,赋予传统戏剧前所未有的沉浸感,允许人们进入其中与角色和场景进行互动。通过定义新的艺术体裁,研究包括故事情节、角色、思想、辞藻、景观和互动等 6 个基本要素,并探讨了驱动戏剧过程的核心 “戏剧 LLM”,面临有限的戏剧资源、不可控制的叙事发展和复杂的指令跟踪等挑战。提出了 “叙事链” 来在与玩家互动过程中更好地控制叙事进展,使用 “自动戏剧” 来合成任意故事的戏剧剧本,以及 “稀疏指令调节” 来允许模型遵循复杂的指令。手动编写了三个剧本:名侦探柯南、哈利波特和罗密欧与朱丽叶,并设计了一个五个维度的原则来全面评估戏剧 LLM。

该文章介绍了一种以LLM为基础的交互式戏剧形式,通过定义新的艺术体裁和使用叙事链、自动戏剧和稀疏指令调节等方法,赋予传统戏剧前所未有的沉浸感和互动性。研究者手动编写了三个剧本,并设计了五个维度的评估原则。

相关推荐 去reddit讨论

MultiCast:使用 LLM 进行零样本多元时间序列预测

原文约400字,阅读约需1分钟。发表于:

使用大型语言模型(LLMs)和 MultiCast 方法,可以通过三种新型的令牌复用解决方案,将多变量时间序列预测问题映射为一维数据的处理,提高预测准确性并减少令牌使用量。在三个真实数据集中,MultiCast 方法在 RMSE 和执行时间方面表现出与现有方法相比的优势。

本研究提出了aLLM4TS框架,用于大型语言模型的时间序列表示学习。通过自监督的多补丁预测任务,捕捉了补丁表示中的时间动态。该框架在多个下游任务中表现出卓越性能,取得了重要进展。

相关推荐 去reddit讨论

语义引导的通用目标劫持 LLM 的提示组织

原文约300字,阅读约需1分钟。发表于:

通过语义导向的提示处理策略,我们提出了一种称为 POUGH 的通用目标劫持方法,用于评估大型语言模型的可信度,并在四个流行的语言模型和十种目标响应类型上进行了实验证实其有效性。

研究提出了LLM-PO方法,可以在没有梯度访问或广泛演示的情况下解决交互式任务。实验表明,LLM-PO的成功率比ICL基线更高或相当,同时需要更少的推理成本。

相关推荐 去reddit讨论

【LLM落地应用实战】LLM + TextIn文档解析技术实测

原文约4900字,阅读约需12分钟。发表于:

文档解析技术是从这些海量且复杂的数据中高效准确地提取有价值信息的关键。它从输入文档图像开始,经过图像处理、版面分析、内容识别和语义理解等流程,最终输出结构化电子文档或语义信息。

赋予机器类人的多模态信息解析才能是实现通用人工智能的一大柱石。现有大模型文档解析的挑战包括图画处理难题、版面剖析难题、内容辨认难题和语义了解难题。TextIn文档解析技能通过文字辨认、计算机图形图画技能和智能图画处理引擎,能够将纸质文档或图片中的文字信息转化为计算机易于处理的文本格局。通过网页在线调用和本地API调试,TextIn能够精准地辨认扫描件中的表格元素。将TextIn文档解析API与LLM的言语了解才能结合,能够打造出高效且强壮的文档处理流程。通过实践,TextIn和LLM能够深入剖析文档内容,提取要害信息,生成摘要和分类总结。TextIn文档解析技能能够实现对各种类型文档的处理需求,提高工作效率。

相关推荐 去reddit讨论

基于 LLM 构建企业专属用户助手:PingCAP 在 TiDB Bot 上的探索和实践

原文约3400字,阅读约需9分钟。发表于:

本文将会介绍 PingCAP 在使用 LLM 构建 TiDB 社区智能助手 TiDB bot 的实践和探索经验。

随着TiDB和TiDB Cloud的推广和应用,全球用户的技术支持变得越来越重要。使用LLM构建社区机器人来辅助完成社区支持工作。难点在于机器人如何准确回答关于TiDB和TiDB Cloud的问题,并将回答限制在这两个领域。使用LLM基于特定领域回答问题,使用RAG方法访问外部知识源,提高回答准确度。使用Few-Shot方式构建提示词进行毒性检测,避免越狱尝试。优化包括毒性识别、理解提问上下文、语义搜索结果不准确。持续优化TiDB Bot的准确度和回答效果。

基于 LLM 构建企业专属用户助手:PingCAP 在 TiDB Bot 上的探索和实践
相关推荐 去reddit讨论