PersonaPlex是一种实时语音对话AI,能够同时听和说,提供自然的交流体验。本文介绍了在Linux上安装和运行PersonaPlex的步骤,包括接受模型条款、安装依赖、构建源代码和启动WebUI服务器。用户可以通过浏览器与AI互动,选择不同的声音模板,进行流畅对话。PersonaPlex的全双工特性使对话更接近人类交流,未来有望与各种工具深度连接,实现高效操作。
微软推出Copilot AI的实时语音对话功能,免费用户也可使用。付费用户在高峰期享有优先权,且可使用深度思考和语音对话等高级功能。
硅谷创业公司Figure发布了新一代人形机器人Figure 02,具备实时语音对话、AI视觉系统、机械手、内置VLM、大容量电池等功能。与OpenAI合作,使机器人具备实时有效的对话能力。外观采用全新的外骨骼结构,布线更好,可靠性更高,具备灵巧的手指。目标是开发通用人形机器人,为人类带来积极影响。
OpenAI邀请少数用户测试ChatGPT的新实时语音对话模式,该模式支持实时语音对话、情感和语调调整以及实时摄像头检测。接受测试邀请的用户的输入,包括语音和视频,将用于模型训练。用户需要谨慎分享敏感信息或使用摄像头捕捉敏感内容,以避免潜在的数据泄露风险。实时摄像头检测功能允许ChatGPT根据摄像头的实时画面进行分析并提供相应答案。新模式可能需要几个月的时间才能正式推出。
OpenAI发布了GPT-4o,一款具备实时语音对话和视觉识别功能的统一多模态模型。该模型展示了流畅的对话和解决数学题的能力,并支持50种语言。合作方还提供了Demo视频。未来,随身佩戴的硬件可能成为AI载体。
完成下面两步后,将自动完成登录并继续当前操作。