本文探讨了大型语言模型(LLM)在越南语和中文教育中的评估与应用。研究表明,经过精细调整的越南语模型表现优异,而中文优先模型在多学科评估中得分较高,但在数学等复杂科目上仍存在不足。提出的E-EVAL和VLUE基准旨在分析LLM的优势与局限,推动教育领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。