本研究探讨了大型语言模型在低资源语言(如新加坡英语)中对齐人类价值观的有效性。通过监督微调和KTO优化,提出了一种更高效且降低毒性的对齐方法,成功将新加坡英语的毒性降低了99%。
研究探讨了新加坡英语词性标注的挑战,通过建立平行数据集和设计特定标注方法,提高标注准确度,揭示方言多样性和上下文依赖性对标注的影响。
完成下面两步后,将自动完成登录并继续当前操作。