标签

 大型语言模型 

相关的文章:

本列表汇集了关于大型语言模型的最新研究与应用,探讨其能力、挑战及未来发展方向,适合对人工智能感兴趣的读者。

大型语言模型中的6大安全风险:平台工程师指南

More organizations than ever are deploying AI models, whether through managed cloud services or self-hosted solutions. According to The State The post 6 Key Security Risks in LLMs: A Platform...

越来越多组织使用AI模型,85%的组织已部署AI服务。平台工程师需应对安全风险,如提示注入、模型提取和私密数据泄露。有效的防护措施包括输入验证、访问控制和资源管理,以确保AI系统的安全与高效。

大型语言模型中的6大安全风险:平台工程师指南
原文英文,约1200词,阅读约需5分钟。发表于:
阅读原文

大型语言模型在推荐医疗治疗时考虑无关信息

Researchers find nonclinical information in patient messages — like typos, extra white space, and colorful language — reduces the accuracy of an AI model.

麻省理工学院的研究发现,大型语言模型在处理患者信息时,非临床信息(如错别字、空格、缺失性别标记等)会影响治疗建议,尤其对女性患者的影响更显著。这表明医疗应用中的模型需经过严格审计,以确保推荐的准确性。

大型语言模型在推荐医疗治疗时考虑无关信息
原文英文,约400词,阅读约需2分钟。发表于:
阅读原文
原文英文,约100词,阅读约需1分钟。发表于:
阅读原文

大规模无监督微调大型语言模型的规律

A widespread strategy for obtaining a language model that performs well in a target domain is to fine-tune it by training it to do unsupervised next-token prediction on data from that...

本文探讨了在目标领域微调语言模型时面临的挑战,如有限数据导致的过拟合和遗忘预训练分布。研究表明,混合1%的预训练数据可以有效防止遗忘并减轻过拟合现象。

大规模无监督微调大型语言模型的规律
原文英文,约200词,阅读约需1分钟。发表于:
阅读原文

解构大型语言模型的偏见

In a new study, researchers discover the root cause of a type of bias in LLMs, paving the way for more accurate and reliable AI systems.

研究发现,大型语言模型(LLMs)倾向于重视文档或对话的开头和结尾信息,忽视中间部分,这种“位置偏见”影响信息检索的准确性。麻省理工学院的研究者探讨了这一现象的机制,认为模型设计和训练数据导致了位置偏见。他们提出的理论框架可用于诊断和修正这一问题,从而提升模型在长对话和复杂任务中的表现。

解构大型语言模型的偏见
原文英文,约1200词,阅读约需5分钟。发表于:
阅读原文

10个大型语言模型关键概念解析

In this article, we explore 10 large language model terms that are key to understanding these formidable AI systems.

本文介绍了理解大型语言模型(LLMs)的十个关键术语,如变换器架构、自注意力机制、预训练和微调等。这些概念有助于理解LLMs的语言处理和输出生成,以及其在特定领域的应用,掌握这些术语有助于跟上AI发展的步伐。

10个大型语言模型关键概念解析
原文英文,约1400词,阅读约需5分钟。发表于:
阅读原文

vLLM简介:高性能大型语言模型推理引擎

The open source vLLM represents a milestone in large language model (LLM) serving technology, providing developers with a fast, flexible The post Introduction to vLLM: A High-Performance LLM...

vLLM是一个开源的大型语言模型推理引擎,专注于内存管理和吞吐量优化。其PagedAttention机制和动态批处理技术提升了内存利用率和处理效率,支持多种硬件平台,兼容OpenAI API,适合大规模部署,推动AI应用发展。

vLLM简介:高性能大型语言模型推理引擎
原文英文,约1300词,阅读约需5分钟。发表于:
阅读原文

呼唤大型语言模型:NVIDIA新AI蓝图助力电信网络配置自动化

Telecom companies last year spent nearly $295 billion in capital expenditures and over $1 trillion in operating expenditures. These large expenses are due in part to laborious manual processes...

NVIDIA推出了电信网络配置的AI蓝图,旨在通过自主网络提升性能和效率。该蓝图利用定制的大型语言模型,自动优化网络参数,减少人工干预,降低成本,提高服务质量。挪威Telenor集团已率先应用此蓝图,推动网络自动化。

呼唤大型语言模型:NVIDIA新AI蓝图助力电信网络配置自动化
原文英文,约1100词,阅读约需4分钟。发表于:
阅读原文

Anthropic开源工具追踪大型语言模型的“思维”

Anthropic researchers have open-sourced the tool they used to trace what goes on inside a large language model during inference. It includes a circuit tracing Python library that can be used with...

Anthropic研究人员开源了一款工具,用于追踪大型语言模型的推理过程。该工具包括一个Python库和图形前端,通过替换模型神经元,利用稀疏激活特征生成归因图,揭示模型内部计算步骤,从而提高LLM的可解释性。

Anthropic开源工具追踪大型语言模型的“思维”
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文

谷歌发布LMEval,一个开源的跨提供商大型语言模型评估工具

LMEval aims to help AI researchers and developers compare the performance of different large language models. Designed to be accurate, multimodal, and easy to use, LMEval has already been used to...

LMEval是一个用于比较大型语言模型性能的工具,支持多种模型和多模态评估。它通过LiteLLM框架实现跨提供商兼容,优化评估效率,并使用Python编写。LMEval还提供可视化仪表板,帮助分析模型表现,评估模型的安全性和准确性。

谷歌发布LMEval,一个开源的跨提供商大型语言模型评估工具
原文英文,约600词,阅读约需2分钟。发表于:
阅读原文