本研究评估了大型语言模型在真实多语言环境中用于健康聊天机器人的表现。分析了24个模型在印度患者数据上的应用,发现模型在印度语言查询中的表现差异显著,尤其在文化和语言混合的查询中面临挑战,指出了健康聊天机器人改进的潜力。
完成下面两步后,将自动完成登录并继续当前操作。