本研究介绍了ViLLM-Eval,一个用于评估基础模型的套件,通过多项选择题和预测下一个单词的任务评估了大语言模型在ViLLM-Eval上的表现。发现这些模型在理解和应对越南语任务方面有待改进。该套件将有助于发现模型的优势和劣势,并提升在越南用户中的性能。
完成下面两步后,将自动完成登录并继续当前操作。