全球AI使用行为报告显示,超过50%的算力用于角色扮演和成人内容,编程位居第二。中国模型迅速崛起,从1.2%增至30%。用户更关注情感交互而非生产力,开源模型因其低价和灵活性受到青睐。
移远通信与炯为智能合作推出AI科普陪伴产品“小熊猫问问”,该产品结合权威科普内容与情感交互,能够精准回应孩子的问题并主动倾听情绪。移远提供LTE/Wi-Fi连接解决方案,确保低功耗与稳定性,实现自然互动与情感识别。
李沐及其团队推出了语音大模型「Higgs Audio V2」,通过引入语音数据,提升了TTS系统的自然性和情感适应性。该模型具备多说话人对话生成和零样本声音克隆等创新功能,在情感交互方面表现突出,标志着音频AI的重大进步。
智元灵犀X2机器人于5月22日启动合作伙伴招募,具备多种运动和交互能力,适用于文娱和教育场景。该机器人有三种版本,支持二次开发,强调情感交互,旨在重塑人机互动,成为智能伙伴。
本研究开发了Voila语音AI代理,能够实时与人类进行情感交互,填补传统系统的不足。Voila采用端到端架构,实现195毫秒的低延迟响应,提升了对话的自然性和个性化,对未来人机交互具有重要意义。
本研究探讨了大型语言模型在情感表达方面的能力。通过角色扮演实验,评估其输出情感的准确性,结果表明LLM能够一致地表达指定情感,为情感交互应用开辟了新前景。
香港科技大学、香港大学和华为诺亚方舟实验室合作开发了EMOVA,一个多模态智能助手,能够处理图像、文本和语音,并通过情感控制实现人性化交流。EMOVA结合视觉编码器和语音分词器,支持情感丰富的语音对话,在复杂图像理解和语音生成方面表现优异。
云知声推出山海多模态大模型,具备智能交互能力,能接收多种形式输入并生成任意组合输出,实现多模态交互体验。山海语音交互具有实时秒回和灵活插话的特点,能感知和表达情绪。山海还能自由切换音色,根据用户需求生成个性化声音。通过摄像头,山海能识别场景和物体信息,并生成符合个性化需求的图像。山海多模态大模型能模拟不同人物性格和对话风格,提供个性化和富有情感的交互体验。云知声将继续发展山海的多模态交互能力,使其成为能够深入理解世界和与人类进行自然交流的智能伙伴。
完成下面两步后,将自动完成登录并继续当前操作。