本研究探讨了视觉语言模型(VLMs)在情感、种族、性别和年龄识别中的应用,结果显示其识别准确性优于传统方法,并展示了新模型的多任务处理能力。
本研究提出了一种适应性人机交互框架,旨在提升社交机器人与不同用户群体的互动效果。该框架结合语音识别和大型语言模型,验证了在年龄识别和用户反馈处理方面的高效性,具有重要的实际应用价值。
完成下面两步后,将自动完成登录并继续当前操作。