HindiLLM:用于印地语的大型语言模型

📝

内容提要

本研究针对印地语和其他印度语言在大型语言模型(LLM)领域的不足进行探索。我们提出了一种新颖的两步预训练方法,首先创建高质量文本语料库进行无监督预训练,然后在不同任务上进行有监督微调,最终取得了在多项语言相关任务中的优越性能。该工作为印地语自然语言处理提供了重要的基准和工具,具有较大的应用潜力。

🏷️

标签

➡️

继续阅读