BriefGPT - AI 论文速递 ·

3DAxisPrompt: Promoting 3D Grounding and Reasoning in GPT-4o

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本研究提出了一种新颖的视觉提示方法——3DAxisPrompt，旨在提升多模态大型语言模型（MLLMs）在3D视觉理解方面的能力。研究表明，该方法能有效感知物体在真实场景中的3D位置，但单一提示方法在所有3D任务中的效果有限。

🎯

🏷️

NVIDIA 发布 Audex (Nemotron-Labs-Audex-30B-A3B)：一种统一的音频-文本大语言模型
NVIDIA 发布了 Audex，这是一个统一的音频-文本大型语言模型，具备理解和生成音频及语音的能力，同时保持文本智能。Audex 采用 30 亿参数的...
初学者的AI代理
我们在freeCodeCamp.org的YouTube频道发布了一门关于AI代理的深入视频课程。课程由CodeCloud创始人Mumshad Mannam...
本周在PSC (231) | 2026年6月29日
文章讨论了一个新的阻碍因素，尽管影响不大，但仍需解决。同时提到在大型语言模型（LLM）政策讨论中有更多活动，计划下周发布相关想法。
让Skill“有图可依”：openJiuwen首发多模态Skill范式Skill-Omni
openJiuwen发布了Skill-Omni，这是首个多模态Skill范式，旨在提升Agent的任务执行能力。该系统通过提取网页和视频中的视觉信息，生成...
报告：欧洲网络如何处理 AI 工作负载
AI 改变了人们对优秀移动网络的定义，而业界过去二十年来一直推崇的峰值下载速度指标如今已无法准确预测网络性能。下载速度最快的网络往往并非最适合应对 AI ...
Sopra Steria 利用 NiCE 提升服务中心绩效，在欧洲推进 AI 驱动的卓越运营
NiCE与Sopra Steria合作，利用CXone平台提升客服中心运营。该平台为客服人员提供AI助手，改善效率和客户体验。Sopra Steria在多...