机器之心 ·

清华领衔发布多模态评估MultiTrust：GPT-4可信度有几何？

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

清华大学等研究人员发布了名为MultiTrust的综合基准，对多模态大语言模型的可信度进行了全面评估。研究人员发现多模态大模型存在幻觉、偏见、隐私泄漏等安全威胁，并维护了一个多模态大模型可信度榜单。未来需要创新高效的算法来提升多模态大模型的可信度。

🎯

❓

MultiTrust基准旨在全面评估多模态大语言模型的可信度，揭示其潜在安全风险。

多模态大模型存在幻觉、偏见、隐私泄漏等安全威胁，影响其可靠性。

MultiTrust基准评估的五个维度是事实性、安全性、鲁棒性、公平性和隐私保护。

闭源商用模型普遍更安全可靠，可信度排名较高，而开源模型在可信性测试中表现出不同的弱点。

提升可信度需要创新高效的算法、多元化的训练数据和持续的动态评估。

MultiTrust基准构建了32个任务场景，覆盖判别和生成任务，基于公开数据集和人工收集的数据。

🏷️

开始在 Amazon Bedrock 上使用 OpenAI GPT-5.5、GPT-5.4 模型和 Codex
OpenAI的GPT-5.5和GPT-5.4模型以及Codex已在Amazon Bedrock平台上线。这些模型专注于代码编写和复杂工作流程，支持开发者通...
模型评估：证明您的路由策略确实有效
本文介绍了DigitalOcean的模型评估功能，帮助团队在真实工作负载下评估不同的推理策略。用户可以通过比较多种模型和路由策略来优化成本、延迟和输出质量...
在Vibe编码时代使OWASP前十名更具影响力
2025年OWASP前十名更新将重点从“过时组件”转向软件供应链安全，新增内存安全和“vibe编码”意识项，反映了开发者和网络应用安全领域对关键安全风险的共识。
B站宣布启动AI创造公开赛打造中国版Build in Public
100亿砸向人形，不如先让10万台机器狗走进家庭
所有通用技术，最后都要回到消费市场。
Mavrix在劳德代尔堡设立美国新总部
Mavrix在佛罗里达州劳德代尔堡设立美国总部，标志着其拓展北美市场的重要一步。该公司专注于数据采集和调研，预计2026年同比增长超过25%。新总部将推动...