谷歌推出了Gemini 3.1 Flash TTS,这是一个改进的文本转语音模型,支持70多种语言,具备自然语言音频标签和多说话人对话功能。该模型在行业基准测试中得分1211,提供复杂的控制层,允许开发者根据场景调整语气、语速和口音。同时,集成的SynthID水印技术可识别AI生成内容,确保信息透明。
Gemini 3.1 Flash TTS是最新的AI语音模型,支持70多种语言,用户可通过音频标签调整语音风格和节奏。所有生成的音频均带有SynthID水印,以防止误信息传播。开发者可在Google AI Studio中使用该模型,创造高保真语音体验。
谷歌推出了Gemini 3.1 Flash TTS,这是最新的文本转语音模型,具备更好的可控性、表现力和音质,支持70多种语言,并提供音频标签以控制语音风格和节奏。所有生成的音频都带有不可见水印SynthID,以防止虚假信息传播。
LongCat-Flash-Prover 是一款开源数学定理证明模型,能够将自然语言问题转化为形式化描述,并通过自动形式化、草稿生成和证明生成三大功能进行严谨证明。该模型在多个基准测试中表现优异,刷新了开源模型记录,展现了 AI 在数学研究中的潜力。
谷歌发布了Gemini 3.1 Flash Live预览版,旨在实现低延迟的实时语音交互。该模型通过原生音频处理提升了嘈杂环境中的语音识别准确性,并支持双向流式传输,允许用户中断对话。同时,开发者可调整推理深度,以优化速度与准确性。
谷歌推出了Gemini 3.1 Flash Live,这是其最高质量的音频模型,旨在提供更自然、可靠的实时对话。该模型支持开发者通过Gemini Live API使用,企业可用于客户体验,用户可通过Search Live和Gemini Live体验。3.1 Flash Live在理解语调和处理复杂任务方面表现出色,能够在嘈杂环境中提供更自然的对话,所有生成的音频都带有水印,以防止虚假信息传播。
谷歌推出Gemini 3.1 Flash Live,增强语音对话能力,支持开发者和企业构建复杂任务的语音代理。该模型在自然对话和多语言支持方面表现出色,能够更好地理解用户情绪,提供快速自然的响应。
谷歌AI推出Gemini 3.1 Flash Live,帮助开发者构建实时语音和视觉代理。该模型提升了对话自然性和响应速度,支持90多种语言,并能在嘈杂环境中更好地执行任务。开发者可通过Gemini Live API集成,增强应用交互体验。
我的第一个ClawHub技能“闪念”已上线,旨在快速记录灵感。用户可以通过语音保存想法,按日期存储为Markdown文件,数据完全属于用户。该技能开源,欢迎贡献和改进。
在236期节目中,讨论了上周的AI新闻,包括OpenAI发布的GPT-5.4和GPT-5.3 Instant,Google升级的Gemini 3.1,Luma推出的多模态模型,以及与国防合同相关的争议。
谷歌推出了Gemini 3.1 Flash-Lite,这是其最快的AI模型,专为高容量开发者工作负载设计,价格为每百万输入/输出令牌0.25美元。尽管比前一版本贵,但性能显著提升,处理速度可达每秒363个令牌,仍比竞争对手快两到五倍,适合高容量任务和数据处理。
谷歌推出了Gemini 3.1 Flash-Lite,这是其最快、最具成本效益的AI模型,适用于高频开发工作。该模型的服务价格为每百万输入令牌0.25美元和输出令牌1.50美元,速度比2.5 Flash快2.5倍,适合翻译和内容审核等任务。早期开发者在AI Studio和Vertex AI上使用该模型,反馈其高效和推理能力。
谷歌推出Gemini 3.1 Flash-Lite,这是其最快、最具成本效益的模型,适用于高频开发。该模型每百万输入令牌0.25美元、每百万输出令牌1.50美元,速度比2.5 Flash快2.5倍,适合实时体验和复杂任务。
谷歌的Gemini 3.1 Flash Lite已在AI Gateway上推出,性能优于2.5版本,特别在翻译、数据提取和代码补全方面有显著提升。该模型适合高负载任务,使用时需在AI SDK中设置为google/gemini-3.1-flash-lite-preview。AI Gateway提供统一API,支持模型调用和性能优化。
谷歌在Gemini 3 Flash中引入代理视觉,结合视觉推理与代码执行,通过“思考-行动-观察”循环分析图像并执行Python代码,提升视觉任务准确率5-10%。该方法细致检查图像细节,增强视觉推理能力,未来将扩展更多功能。
Adobe宣布将于3月1日停止销售Adobe Animate,标志着Flash动画制作工具的终结。尽管Flash已被视为过时,仍有许多动画依赖其工作流程,尤其在日本动画业引发强烈反响。Adobe在用户压力下决定继续维护该工具,显示出对其重要性的重视。Flash虽已衰退,但仍是一个时代的象征。
2026年2月,Adobe宣布Adobe Animate进入维护模式,标志着Flash时代的结束。Flash曾是动画和网页交互的标准,但随着技术进步,其功能已被分散到其他软件和行业,网页动画转向HTML5和JavaScript,专业软件接管了动画制作。Flash的遗产以不同形式继续存在,但不再统一。
AI时代如同2008年智能手机市场,需创新Agent模型。阶跃星辰发布的Step 3.5 Flash模型,采用稀疏MoE架构,参数仅1960亿,强调高效与逻辑,适应L3时代需求,展现更强推理能力和速度,推动AGI梦想。
阶跃星辰发布了开源基座模型Step 3.5 Flash,专为实时Agent工作流设计,推理速度可达每秒350个token。该模型采用稀疏MoE架构,提升推理效率,降低企业应用大模型的门槛。多家芯片厂商已完成适配,促进模型与算力的协同发展。
美团LongCat团队推出了开源模型LongCat-Flash-Thinking-2601,拥有5600亿参数,旨在解决智能体在复杂环境中的适应性问题。该模型通过环境扩展、强化学习和噪声训练,在多领域任务中表现出色,显著提升了泛化能力和决策稳定性。
完成下面两步后,将自动完成登录并继续当前操作。