本研究提出了COMI-LINGUA,一个大型手动标注的数据集,旨在捕捉印地语与英语代码混合的语言细微差别。通过对100,970个实例的专家评估,揭示了现有多语言建模策略的局限性,并强调了改进代码混合文本处理能力的必要性。
完成下面两步后,将自动完成登录并继续当前操作。