BriefGPT - AI 论文速递 ·

通过大型模型进行视觉语言导航中的可纠正的地标发现

📝

内容提要

Vision-Language Navigation (VLN) requires the agent to align landmarks based on instruction and visual observations. This paper proposes CONSOLE, a new paradigm that treats VLN as an open-world...

➡️

继续阅读

开放模型，封闭环境：Palantir与NVIDIA Nemotron为美国机构提供安全的AI
Palantir与NVIDIA合作推出基于开放模型的智能引擎，为美国政府机构提供安全的AI解决方案。这些模型增强了透明度和可定制性，帮助政府在敏感环境中高...
模型上新：阿里推出 Fun-ASR-Flash，从“听清楚”走向“听明白”
阿里推出的Fun-ASR-Flash语音识别模型支持三十种语言和十六种方言，准确率达到87.8%。该模型通过上下文和热词减少语义歧义，提升了对方言和小语种...
美国拟解禁Anthropic旗下AI模型Fable 5，公众访问最早本周恢复
美国政府计划放宽对人工智能公司Anthropic的Fable 5模型的出口管制，预计本周解除。此前因国家安全风险，Anthropic暂停了Mythos 5...
折腾过各种语言后，我为什么总是回到 Go 语言？
在软件开发中，程序员常感到“技术栈焦虑”。尽管有许多新兴编程语言，许多开发者仍然选择Go语言。Go的标准库减少了决策疲劳，提供高效的诊断工具，简化并发处理...
Hermes MoA堆叠多个前沿模型：性能优于Opus 4.8和GPT-5.5
Hermes的MoA功能允许多个AI模型组合使用，性能优于单个模型如Opus 4.8和GPT-5.5。但使用MoA的成本和延迟显著增加，调用次数可能高达8...
抱抱脸模型TOP榜，我现在只服yuxinlu1
个人开发者逯雨鑫在Hugging Face上发布的编程助手和本地Agent模型，下载量超过70万，成功进入大厂模型前列。他通过自费项目提升自己，强调模型质...