BriefGPT - AI 论文速递 ·

POP-3D：基于图像的开放词汇 3D 实占预测

💡 原文中文，约300字，阅读约需1分钟。

📝

内容提要

我们提出了一种使用3D语义体素占用图进行预测开放词汇的方法。该方法包括新的模型架构，三模态自监督学习算法和实验证明的优势。

🎯

🏷️

Google is open-sourcing its 3D emoji
Now, if you want to, you can use Google's 3D emoji in your own creations....
对 Gemini 也开始祛魅了，所有 AI 终局不过如此
很久以前从 GPT 切到 Gemini 就是看中了那份果断准确，无幻想不废话，经过版本迭代后变成了类似国内，GPT 等等一切的迎合，捏造，幻想的纯废品 A...
源代码显示Codex已经将窗口从372K下调到272K 还特别注明禁止删除用户目录
#软件资讯源代码显示 Codex 已经将窗口从 372K 下调到 272K，系统提示词还特别增加：无论如何都禁止执行 rm -rf $HOME 命令。下...
Zendesk 研究发现：更出色的联络中心 AI 能推动交互量增长，而非减少
十年前，随着联络中心陆续引入在线聊天、即时通讯应用和社交媒体渠道，咨询量骤然激增。将咨询转至“低成本”渠道的初衷并未如预期般奏效，反而导致咨询量和总体成...
这个网站整理了苹果历史上的失败产品
这个网站整理了苹果历史上的失败产品 https://startuptalky.com/apple-failed-products/。有时间轴，有每款产品的...
FlashTTS：面向实时语音对话的低时延流式语音合成 | Interspeech 2026
近年来，基于大语言模型（LLM）的文本转语音技术快速发展，基于大语言模型（LLM）的TTS方案已经在自然度、音色相似度和零样本音色克隆（zero-shot...