标签

 语言模型 

相关的文章:

本列表汇集了关于语言模型的最新研究成果与应用案例,涵盖模型优化、序列建模及其在各领域的实际应用,助力深入理解语言模型的前沿动态。

重新审视语言模型中的不确定性量化评估:与响应长度偏差结果的虚假交互

Uncertainty Quantification (UQ) in Language Models (LMs) is key to improving their safety and reliability. Evaluations often use metrics like AUROC to assess how well UQ methods (e.g., negative...

语言模型中的不确定性量化(UQ)对安全性和可靠性至关重要。研究表明,UQ方法与任务正确性函数之间的偏差会系统性扭曲评估结果,影响AUROC排名。分析显示,正确性函数的长度偏差与UQ方法的长度偏差相互作用,导致评估失真。使用LM作为评判者的方法被认为是最不受长度偏差影响的,提供了更公平的UQ评估路径。

重新审视语言模型中的不确定性量化评估:与响应长度偏差结果的虚假交互
原文英文,约200词,阅读约需1分钟。发表于:
阅读原文

微软推出Mu:一种轻量级的本地语言模型,用于Windows设置

Microsoft has introduced Mu, a new small-scale language model designed to run locally on Neural Processing Units (NPUs), starting with its deployment in the Windows Settings application for...

微软推出Mu,一个小型语言模型,旨在本地运行于神经处理单元(NPU)上。Mu具有3.3亿参数,能够通过自然语言控制Windows设置,减少对云处理的依赖。经过微调后,Mu能快速响应用户指令,如“关闭蓝牙”,并计划扩展支持更多设置。

微软推出Mu:一种轻量级的本地语言模型,用于Windows设置
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文

Dev Proxy v0.29:架构重构、MCP服务器和开放的语言模型提示

Introducing Dev Proxy v0.29, with a major architectural overhaul, control over language model prompts, and improved diagnostics. The post Dev Proxy v0.29 with refactored architecture, MCP server,...

Dev Proxy v0.29发布,进行了架构重构,增强了语言模型提示控制和诊断功能,支持自然语言配置,改进了日志记录,简化了插件架构,并清理了卸载时的证书。

Dev Proxy v0.29:架构重构、MCP服务器和开放的语言模型提示
原文英文,约900词,阅读约需4分钟。发表于:
阅读原文

您应该为您的应用选择哪些视觉语言模型

Vision language models (VLMs) are a promising subset of multimodal AI, capable of processing the two different modalities of text The post Which Vision Language Models Should You Use for Your Apps...

视觉语言模型(VLMs)是多模态AI的重要分支,能够处理文本和图像,执行描述、搜索和生成等任务。当前流行的VLM包括OpenAI的GPT-4o、Meta的Llama 4和Google的Gemini 2.5 Flash。评估VLM性能的方法有图像描述和视觉问答,常用数据集包括LAION-5B、VQA和Visual Genome。尽管VLM功能强大,但仍面临偏见和成本等挑战。

您应该为您的应用选择哪些视觉语言模型
原文英文,约1500词,阅读约需6分钟。发表于:
阅读原文
发表于:
阅读原文

Mistral AI发布了首个专注于推理的语言模型Magistral

Mistral AI has released Magistral, a new model family built for transparent, multi-step reasoning. Available in open and enterprise versions, it supports structured logic, multilingual output, and...

Mistral AI发布了Magistral模型系列,支持多步骤推理,适用于法律、金融和医疗等领域。该模型具备多语言输出,强调逻辑清晰和可追溯性。Magistral Medium在AIME 2024中表现出色,但用户对其性能与可用性的平衡存在分歧。目前的上下文限制为40K tokens,未来可能扩展。

Mistral AI发布了首个专注于推理的语言模型Magistral
原文英文,约400词,阅读约需2分钟。发表于:
阅读原文

语言模型到底能记忆多少内容?Meta 的新框架定义了比特级的模型容量

现代语言模型的记忆行为面临越来越多的质疑。例如,一个拥有 80 亿个参数的转换器,需要用 15 万亿个词元进行训练,研究人员开始质疑这些模型是否能够以有意义的方式记忆训练数据。数据...

研究者质疑现代语言模型的记忆行为,提出新方法评估模型对数据点的理解,区分非预期记忆与泛化。实验表明,GPT系列模型的记忆容量约为3.6位/参数,且随着训练集增大,记忆力下降。该研究为理解模型行为提供了框架,推动未来模型评估与隐私研究。

语言模型到底能记忆多少内容?Meta 的新框架定义了比特级的模型容量
原文中文,约1500字,阅读约需4分钟。发表于:
阅读原文
发表于:
阅读原文

8k长序列建模,蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

阿布扎比 Inception AI 研究所与硅谷 Cerebras Systems 公司的联合研究团队开发了 Prot42 ——首个仅依赖蛋白质序列信息、无需 3D 结构输入的蛋白质语言模型(PLMs)家族,实现了长序列建模与高亲和力结合剂生成,为蛋白质设计领域带来颠覆性突破。

蛋白质结合剂在疾病诊断和药物递送中至关重要。阿布扎比和硅谷的研究团队提出的新模型Prot42,仅依赖蛋白质序列生成高亲和力结合剂,显著提高了蛋白质设计的效率。

原文中文,约6300字,阅读约需15分钟。发表于:
阅读原文

苹果设备和服务器基础语言模型的更新

With Apple Intelligence, we're integrating powerful generative AI right into the apps and experiences people use every day, all while protecting their privacy. At the 2025 Worldwide Developers...

苹果在2025年全球开发者大会上推出新一代语言基础模型,增强Apple Intelligence功能,支持15种语言,并优化在Apple硅上的运行效率。新框架为开发者提供直接访问模型的能力,旨在提升隐私保护和生成AI应用。

苹果设备和服务器基础语言模型的更新
原文英文,约4400词,阅读约需16分钟。发表于:
阅读原文