在GITEX GLOBAL展会上,Soul展示了其AI社交产品,结合3D虚拟人和多模态互动。用户可以创建3D形象,与AI进行语音、文本和视觉交互。Soul计划在11月推出全双工视频通话功能。展会吸引了众多科技公司,展示AI在社交领域的创新。
本文探讨了非语言信号的自动分析,提出了NVI数据集和NVI-DET任务,验证了其在多模态互动中的有效性,重点分析了面部表情和头部动作等非语言特征,以提升人机交互的社交适切性和理解能力。
本文介绍了一种名为标准化测试套件(STS)的方法,用于评估智能体在与人类进行多模态互动中的表现。STS通过真实人类互动数据构建行为场景,记录智能体的表现并由人类评估成功与否。该方法旨在提高评估的控制性和速度,促进人机互动研究的发展。早期实验显示自动化标注可能可行,从而实现快速有效的评估。
完成下面两步后,将自动完成登录并继续当前操作。