💡
原文中文,约7000字,阅读约需17分钟。
📝
内容提要
OpenAI发布了Sora 2视频生成模型,提升了视频的真实感和画质,并支持用户生成客串视频。同时,Claude Sonnet 4.5和GLM-4.6等AI技术也相继推出,增强了编程和推理能力。AI领域竞争加剧,各大公司纷纷推出新产品,推动技术进步。
🎯
关键要点
- OpenAI发布Sora 2视频生成模型,提升视频真实感和画质,支持用户生成客串视频。
- Sora 2模型的iOS应用内置TikTok风格视频信息流,用户可上传肖像生成视频。
- Anthropic发布Claude Sonnet 4.5,编程和推理能力强,性价比高。
- 智谱AI发布GLM-4.6,支持更长上下文,提升编码和推理性能。
- DeepSeek发布DeepSeek-V3.2-Experimental,采用稀疏注意力机制,降低计算量。
- 腾讯发布混元生图3.0,开源权重的多模态模型,效果显著。
- 阿里云发布Qwen3系列模型,视觉理解能力显著提升。
- Hume AI推出Octave 2文本转语音模型,支持多语言和情感理解。
- 俄罗斯AI实验室开源Kandinsky 5.0 T2V Lite,提供轻量级视频生成方案。
- ServiceNow发布多模态推理模型Apriel-1.5-15B-Thinker,增加图像推理能力。
- Liquid AI发布LFM2-Audio-1.5B音频语言模型,支持实时助手。
- Perplexity推出Comet智能体浏览器,结合问答引擎和研究导向界面。
- Opera发布AI浏览器Neon,主打智能体辅助功能。
- 谷歌推出Jules工具集,扩展编程智能体的集成能力。
- Gemini取代Google Assistant成为谷歌Nest和Home设备的默认语音助手。
- 谷歌在Snapseed新增交互式图像分割功能,提升用户体验。
- 谷歌预览Gemini 2.5模型,能在用户界面中执行操作。
- 特斯拉展示Optimus机器人学习功夫,强调AI驱动。
- 谷歌研究提出协同图像生成工作流,减少提示词调整麻烦。
- 麻省理工学院揭幕TX-GAIN超级计算机,专为生成式AI优化。
- Meta提出元认知复用机制,让模型总结解题思路。
- OpenAI与AMD签署股权协议,筹集资金以增强计算能力。
- OpenAI召开开发者大会,发布应用程序开发框架。
- OpenAI与韩国企业合作,扩展AI数据中心布局。
- xAI进行200亿美元融资,英伟达参与其中。
- Meta将用户与AI助手的聊天记录用于个性化推送。
- 欧盟计划投资10亿欧元推动AI技术应用。
- 美国商务部拟议版权规则,影响AI公司训练数据使用。
- 环球音乐与AI公司达成授权协议,重塑音乐产业。
- OpenAI为Sora 2增加版权控制功能,回应好莱坞抗议。
- OpenAI回应马斯克的骚扰策略,保护员工。
- AI视频模型缺乏物理推理能力,存在安全隐患。
❓
延伸问答
Sora 2视频生成模型有哪些主要功能?
Sora 2提升了视频的真实感和画质,支持用户通过肖像生成客串视频,并实现音画同步。
Claude Sonnet 4.5与其他AI模型相比有什么优势?
Claude Sonnet 4.5在编程和推理能力上表现优异,性价比高,尤其在编程基准测试中取得了顶尖成绩。
GLM-4.6模型的主要改进是什么?
GLM-4.6支持更长的上下文,提升了编码和推理性能,并降低了token消耗。
DeepSeek-V3.2模型采用了什么新机制?
DeepSeek-V3.2引入了稀疏注意力机制,显著降低了长上下文场景下的计算量。
特斯拉的Optimus机器人在学习什么技能?
特斯拉的Optimus机器人正在学习功夫,展示了AI驱动的能力。
OpenAI如何应对好莱坞对Sora 2的版权抗议?
OpenAI为Sora 2增加了版权方对角色使用的控制功能,以回应好莱坞的抗议。
➡️