实时互动网 ·

Thinking Machines 展示了近乎实时的AI语音和视频对话预览，并采用了新的交互模型

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

Thinking Machines公司正在开发一种新型AI交互模型，采用全双工架构，能够同时处理输入和输出，显著降低响应延迟。研究表明，该模型在交互质量和速度上优于现有系统，未来可能改变企业AI应用方式，提升实时监控和客户服务的效率。

🎯

🔎

Thinking Machines的全双工架构显著提升了AI的交互能力，使其能够实时处理输入和输出。这种设计不仅减少了响应延迟，还能在用户输入时进行反向沟通，提升了交互的自然性和流畅性。这对于需要快速反应的应用场景，如客户服务和安全监控，具有重要的实际意义。

Thinking Machines的交互模型在企业级应用中展现出巨大的潜力。其能够实时监控和主动介入，尤其适用于高风险环境，如制造业和实验室。这种能力将改变企业对AI的依赖方式，使其不仅仅是工具，而是主动的协作伙伴，提升工作效率和安全性。

尽管Thinking Machines的模型在交互质量和速度上表现优异，但目前仍处于研究预览阶段，尚未全面开放。未来的广泛应用将面临技术整合和用户反馈的挑战。企业在考虑采用此类技术时，应关注其实际应用效果和潜在的技术限制。

❓

该模型采用全双工架构，能够同时处理输入和输出，显著降低响应延迟，交互质量和速度优于现有系统。

该模型实现了0.40秒的响应速度，能够实时监听客户反馈，提供更自然的对话体验，从而提升客户服务效率。

全双工架构允许模型实时监听和对话，解决了传统AI模型的协作瓶颈，提高了交互的流畅性和自然性。

在FD-bench测试中，该模型的交互质量得分为77.8分，响应速度为0.40秒，显著优于竞争对手。

模型能够实时监控视频流，主动介入安全违规情况，无需等待用户反馈，适用于高风险环境。

公司计划在未来几个月内开放有限的研究预览，并在今年晚些时候进行更广泛的发布。

🏷️