机器之心 ·

视觉模型学会LLM独门秘籍「上下文记忆」，迎来智能涌现的大爆发！

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

国产视频模型Vidu 1.5实现了多主体一致性，能够自然融合多张图像生成视频，并具备上下文记忆能力，提升了视频生成的灵活性和复杂性。这标志着视频模型在智能化方面的重大突破，可能加速AGI的发展。

🎯

❓

Vidu 1.5实现了多主体一致性，能够自然融合多张图像生成视频，并具备上下文记忆能力。

Vidu 1.5通过上下文记忆能力，能够理解和关联多个主体特征，提升了视频生成的灵活性和复杂性。

Vidu 1.5告别了LoRA，采用通用架构支持泛化任务，能够更高效地处理多主体和复杂场景。

Vidu 1.5通过统一问题形式和架构，能够在多输入间建立关联，理解复杂描述并输出符合逻辑的内容。

Vidu 1.5的突破可能打通前往AGI的关键一环，推动视觉模型领域的智能涌现。

Vidu 1.5能够同时理解多个主体特征，并将其自然融合，生成符合指令要求的视频。

🏷️

标准智能：在像素空间中训练通用智能
标准智能公司正在探索通过视频数据训练通用智能代理的可能性。他们的模型分析计算机使用的原始视频数据，以预测鼠标移动和点击等操作。创始人Galen Mead和...
微软与OpenAI新协议的详细解析
微软与OpenAI达成新协议，允许OpenAI在所有云平台上提供服务，尽管与亚马逊的合作令微软不满。协议取消了与人工通用智能（AGI）相关的条款，使双方关...
通过语义元数据Delta共享在Databricks中解锁SAP业务上下文
SAP Business Data Cloud与Databricks Unity Catalog的合作实现了语义元数据的自动同步，使SAP数据更易理解和发...
埃隆·马斯克确认xAI使用OpenAI的模型来训练Grok
埃隆·马斯克在加州法庭作证称，他的AI初创公司xAI使用了OpenAI的模型来提升技术。他提到“模型蒸馏”是行业常见做法，允许大型AI模型作为“教师”训练...
这些智能眼镜都没什么用
智能眼镜虽然时尚、舒适且功能强大，但尚未实现预期的生活改变。它们提供便利，如导航和信息显示，但大多数AI功能仍不够实用，隐私问题也令人担忧。用户对这些设备...
OpenAI的新安全模型仅面向‘关键网络防御者’
OpenAI即将推出新的网络安全模型GPT-5.5-Cyber，首批仅向“可信的网络防御者”发布。CEO萨姆·阿尔特曼表示，此次有限发布旨在增强机构的网络...