小红花·文摘

JiBA是一款软件，能够自动修复Apple Music中日语歌曲的罗马音和中韩歌曲的翻译名，恢复为原始文字，并支持通过iCloud同步到其他设备。

苹果fans博客 ·

蓝点网 ·

在Windows上使用国土交通部的公共数据时，文件会出现韩文乱码。用Excel打开可正常显示，但在VSCode或Python中会乱码。解决方法是用Python读取文件并以UTF-8编码写入新文件，然后跳过前15行读取CSV数据。

DEV Community ·

Design Shack ·

小众软件 ·

James Shore ·

该文介绍了一种考虑词素的子词切分方法，用于解决韩语中字节对编码（BPE）的挑战。该方法在预训练语言模型中平衡了语言准确性和计算效率，并在评估中表现良好，提高了句法任务的结果。

BriefGPT - AI 论文速递 ·

本文介绍了一种基于情感分析的新数据集，并训练了一个强大的情感分类器用于议会会议。同时，引入了第一个领域特定的LLM用于政治科学应用，并在27个欧洲议会的会议记录中进行了1.72亿专业领域词汇的预训练。实验证明，LLM在议会数据上的额外预训练可以显著提高模型的性能，尤其是在情感检测等具体领域任务上。

BriefGPT - AI 论文速递 ·

本研究介绍了韩文中最大的冒犯性语言语料库K-HATERS，包含192K个新闻评论，可检测不同程度的仇恨表达。研究者采用认知反思测试作为标签质量的代理，解决了人类注释中的潜在噪声和偏差。该研究对仇恨言论检测和自然语言处理资源构建具有重要贡献。

BriefGPT - AI 论文速递 ·

该研究利用韩国SNS平台的大规模数据集，通过多任务学习和基于BERT的语言模型，实现了对用户生成文本的分类，超越了人类水平的准确性。该方法为减轻仇恨言论和偏见提供了实际解决方案，有助于提升在线社区的健康。

BriefGPT - AI 论文速递 ·