ChatGPT是一种语言模型,对非“标准”英语存在偏见,包括刻板印象和贬低内容,理解能力较差,回答傲慢。该模型更多地模仿标准美式英语,但也经常模仿使用人数更多的其他变体。它默认使用美国惯例,对非美国用户造成了困扰。母语者评级显示,对非“标准”英语的回答在刻板印象、理解能力、自然度和傲慢程度方面较差。新一代模型GPT-4加剧了刻板印象。这种现象延续了语言歧视,强化了权力动态,对少数语言社群造成了伤害。
本研究分析了多语言大型语言模型中的偏见问题,发现多语言训练可能加剧对保护群体的偏见。提出了LDFighter机制以减轻语言歧视,确保不同语言用户获得一致服务。研究表明,模型的偏见程度与语言的NLP资源量相关,且在多语言环境中评估和减少性别偏见面临挑战。
本文研究了知识编辑中源语言对目标语言的影响,探讨了大型语言模型(LLMs)在多语言环境中的表现及语言歧视问题。通过构建跨语言数据集,分析了不同语言的模型编辑方法及其性能,并提出了基于相似度的投票机制LDFighter,以提升不同语言用户的服务一致性和响应质量。
本研究评估了大型语言模型(LLMs)在口语任务导向对话中的表现,发现其对口头噪音的鲁棒性不足,但通过微调可以提升性能。同时,研究探讨了LLMs在多语言支持中的一致性,提出LDFighter机制以减轻语言歧视,确保不同语言用户获得一致服务。此外,强调了数据增强技术在提升方言理解能力和翻译质量中的重要性。
完成下面两步后,将自动完成登录并继续当前操作。