Moshi是一款实时口头对话系统,具有连贯且上下文准确的语音生成功能,延迟仅为160毫秒。它能够处理重叠语音和中断,语音质量好且易懂。Moshi能够维持长时间对话,上下文跨度超过五分钟,并在口头问答任务中表现出色。它代表了口头对话系统的重大飞跃,树立了新标准。
完成下面两步后,将自动完成登录并继续当前操作。