小红花·文摘

本文分析了成语中数字词的使用情况，发现约8.2%的四字成语含有数字，且数字的组合和位置存在规律。研究表明，数字“一”的使用频率最高，奇数在成语中更受欢迎，揭示了成语的文化内涵。

用数据分析项目，带你走进成语里的数字世界

少数派 ·

做了一个小游戏：笔画猜成语

Limboy ·

本研究解决了不同提示方法和大型语言模型（LLMs）与神经机器翻译（NMT）组合在成语翻译中的影响尚未深入研究的空白。通过引入包含成语的双语数据集并评估多种模型，研究发现Claude-3.5-Sonnet在翻译中表现出色，而结合较弱的LLMs与谷歌翻译可以改善英语到波斯语的翻译结果，这为未来的翻译系统提供了重要的见解。

波斯语-英语成语翻译中大型语言模型、神经机器翻译模型及其组合的比较研究

BriefGPT - AI 论文速递 ·

一个成语要用一千年，才能完成最美的进化

笨方法学写作 ·

本文探讨了多种自然语言处理技术，包括情感分析、习语分类和情感词典的构建。研究提出了基于BERT的模型和双重嵌入方法，提升了成语预测和机器阅读理解的性能，并提出了Emotional Chain-of-Thought方法，增强了大型语言模型在情感生成任务中的表现。

双链思维提示法：情感词典的成语扩展

BriefGPT - AI 论文速递 ·

本文提出了一种采用三元损失、自适应对比学习和重采样挖掘器来建立一个适用于训练语言模型的成语感知的学习目标的方法，用于有效地对成语性进行建模，在 SemEval 挑战赛中获得了显著的性能提升。

通过自适应对比三元损失增强多语言中的成语表示

BriefGPT - AI 论文速递 ·

通过结合数据增强技术和词汇简化，我们提出了一种名为 RISS（Readability-guided Idiom-aware Sentence Simplification）的新框架，用于解决中文句子简化面临的挑战，包括缺乏大规模标记平行语料库和惯用语的普遍存在。RISS 通过多阶段和多任务学习策略将 RPS 和 IAS...

基于可读性引导的成语感知句子简化（RISS）对中文的应用

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型 (LLMs) 在习语语言处理方面的应用。我们介绍了由语言专家设计的新的难题数据集 “IdioTS”，用于评估 LLMs 在句子级别处理比喻语言的能力。我们提出了一种基于习语检测任务的综合评估方法，其中 LLMs 被提示在给定的英文句子中检测习语表达。我们对结果进行了全面的自动和手动评估，并进行了广泛的错误分析。

对话大型语言模型中的成语检测：一道难题

BriefGPT - AI 论文速递 ·

这篇论文研究了大型语言模型（LLMs）在理解语境和自然语言处理中的能力，指出其在对话推理和特定领域（如医学、法律）的表现仍需改进。通过评估多个模型，强调个性化调整和零-shot推理在提升模型性能方面的重要性，特别是在情感识别和仇恨言论检测等任务中。

时代之符号：评估大型语言模型在成语辨析中的应用

BriefGPT - AI 论文速递 ·

本文介绍了开放事件知识图谱（OEKG），它是一个多语言、事件中心、时间性的知识图谱，由多个数据集组成，包括问答、实体推荐和命名实体识别。OEKG通过与事件中心的知识图EventKG链接，描述了公共模式，并在三个用例中演示了其用法。OEKG及其查询端点是公开可用的。

IEKG：一种用于成语表达的常识知识图谱

BriefGPT - AI 论文速递 ·

本研究描述了习语翻译及相关问题，并找到了适合使用习语翻译的临界点。同时，编制了一个包含约4千个自然句子的数据集，并引入了两种简单有效的技术来提高强大预训练机器翻译模型的准确度。

生成多语种成语引申语境

BriefGPT - AI 论文速递 ·

一《甲方乙方》是中国第一部贺岁片，可以说，凭一己之力，定义了一个电影类型：贺岁片。这两天忽然想再看看这部1 更多...

说个成语你们听

扯氮集 ·

拼音猜成语

Limboy ·

我发现用 Nebula Graph 的图查询解 Antfu 的汉兜（最好的中文成语版 wordle 👉🏻 handle.antfu.me）特别有意思，很适合每天写图库语句的体操练习，本文揭示如何用知识图谱作弊解汉兜😁 1 什么是汉兜？汉兜（https://handle.antfu.me）是由 Vue/Vite 核心团队的 Antfu 的又一个非常酷的作品，一个非常精致的汉字版的...

图数据库体操：用 Nebula Graph 搭成语图谱解汉兜

siwei.io ·