小红花·文摘 - 小红花技术领袖俱乐部

本研究探讨了大型语言模型在低资源语言（如新加坡英语）中对齐人类价值观的有效性。通过监督微调和KTO优化，提出了一种更高效且降低毒性的对齐方法，成功将新加坡英语的毒性降低了99%。

Safety at the Margins: A General Approach to Safety Alignment in Low-Resource English Languages — A Case Study of Singlish

BriefGPT - AI 论文速递 ·

研究探讨了新加坡英语词性标注的挑战，通过建立平行数据集和设计特定标注方法，提高标注准确度，揭示方言多样性和上下文依赖性对标注的影响。

新加坡英语标注中的挑战

BriefGPT - AI 论文速递 ·