机器之心 ·

「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

上海交通大学推出全球首个支持多人实时口语对话的语音情感大模型“交交”。该模型具备多人对话、身份识别、多语言支持和情感理解等功能，能够与多位用户自然互动，精准识别身份并提供个性化回应，同时支持多种语言和方言，满足知识问答需求，展现出强大的语音理解与交互能力。

🎯

关键要点

上海交通大学推出全球首个支持多人实时口语对话的语音情感大模型“交交”。
该模型具备多人对话、身份识别、多语言支持和情感理解等功能。
“交交”能够与多位用户自然互动，精准识别身份并提供个性化回应。
支持汉语、英语、日语和法语四大主流语言，具备跨语言回复能力。
对中文进行了特殊优化，具备强大的方言识别与理解能力。
能够根据对话内容理解用户情绪，生成富有情感的回应。
“交交”是一个知识宝库，能够进行古诗词背诵、科学原理讲解等。
采用鲁棒的音频编码器，具备良好的抗噪能力和多人理解能力。
基于创新的跨模态对齐机制，实现多语言语音信号与文本的精准映射。
通过构造多人对话数据，增强模型的对话处理能力。
在语音对话大模型的测试中，“交交”展现出卓越的表现。
在多语言测试中，模型在中文、日文、法文上的表现显著优于其他模型。
研发团队来自上海交通大学，专注于听觉人工智能与计算声学领域的研究。
“交交”重新定义了人机交互的方式，让对话更加自然、智能、有趣。

🏷️

继续阅读

打败GPT-5.2，嵌入真实工业生产，这个大模型什么来头？
思谋科技的IndustryGPT在工业场景中表现优异，超越了GPT-5.2等通用大模型。通过三场考试，IndustryGPT展示了其在工业知识、工程决策能...
龙虾最大痛点被官方插件升级！对话永不忘记，GPT和Gemini最强模型都可接入
龙虾发布了OpenClaw测试版，新增上下文管理插件，增强对话记忆能力，支持多种上下文策略，解决长对话中的信息丢失问题。lossless-claw插件可持...
AReaL x 昇腾，加速大模型全异步RL训练创新
AReaL框架通过全异步强化学习训练，简化大模型开发，提升训练效率和系统可靠性。其核心优势在于解耦式Agentic RL和Single Controlle...
llmfit – 1秒测出：你的电脑能跑哪些 AI 大模型
llmfit 是一款跨平台工具，能够快速检测电脑硬件并列出可运行的 AI 大模型，提供模型评分和推理速度等信息。其优势在于隐私保护、低成本和离线使用，适合...
从对话到知识：AI Agent 记忆系统的设计与实现
AI Agent 技术逐渐明晰，架构包括感知、决策、存储和行动四个部分。记忆是存储的核心，分为短期和长期记忆，支持上下文一致性、个性化学习和复杂任务拆解。...
Umair Shahid：将PostgreSQL高可用性视为分层设计
PostgreSQL的高可用性应采用分层设计，首先明确故障范围、恢复点目标（RPO）和恢复时间目标（RTO）。从单主节点开始，逐步引入离线备份、WAL归档...

「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！

内容提要

关键要点

标签

继续阅读