小红花·文摘

本文探讨了大型语言模型（LLM）在越南语和中文教育中的评估与应用。研究表明，经过精细调整的越南语模型表现优异，而中文优先模型在多学科评估中得分较高，但在数学等复杂科目上仍存在不足。提出的E-EVAL和VLUE基准旨在分析LLM的优势与局限，推动教育领域的发展。