Grok 4.3已在Vercel AI Gateway上线,知识截止至2025年12月,具备100万标记的上下文窗口。该模型在准确性、工具调用和指令执行方面有所提升。使用时需在AI SDK中设置为xai/grok-4.3,AI Gateway提供统一API,支持模型调用、使用跟踪和性能优化。
文章讨论了纳米机器人训练过程中使用的数据,包括数学、选择题和对话等多种模式。这些训练数据旨在提升模型的对话能力和问题回答的准确性。
何恺明团队提出了一种新方法,将去噪技术与哈密顿神经网络结合,克服了传统机器学习在物理问题上的局限。该方法通过Block-wise哈密顿量设计和掩码建模策略,提升了模型在正向模拟、表征学习和轨迹插值任务中的准确性和鲁棒性。
本文提出了一种新型多模态大语言模型AKI,解决了视觉与语言不对齐的问题。通过将因果注意力转化为模态互注意力,AKI显著提升了模型在理解基准上的表现,推动了多模态研究的发展。
本研究探讨了利用合成数据和领域知识改善心脏LGE MRI图像超增强检测的方法。通过增强合成数据和标准化图像方向,提升了模型在小规模临床数据集上的表现,为心脏MRI研究提供了新思路。
本研究提出了一种新方法,通过结合医学知识和增强特征重演,解决胸部CT图像中的自监督学习挑战,显著提升模型特征表示能力,实验结果优于现有技术。
本研究评估大型语言模型(LLM)代理的自我推理能力,填补了代理任务研究的空白。通过考察自我修改和知识寻求等情境,发现只有前沿模型具备此能力,且高度依赖上下文。未来模型的提升可通过评估测量实现。
本文介绍了一种名为“词的思考”(ToW)的数据增强方法,用于改善下一词预测中的事实幻觉和效率问题。通过从大型模型中提取ToW注释,使用70K注释可提升模型推理能力7%至9%,并减少高达10%的幻觉现象,显示出显著潜力。
该研究提出了一种新的细粒度评估方法,通过自动生成细微差异的测试字幕,提升视频-文本检索模型对细微差异的理解能力,并揭示当前评估基准的不足。
完成下面两步后,将自动完成登录并继续当前操作。