本研究探讨了大型语言模型(LLMs)的数据收集方法及其在多语种环境中的应用,强调文化维度和伦理挑战。分析了偏见和有害信息的传播,并提出了改进LLMs的建议,以促进更公平和负责任的技术发展。
本文研究了预训练语言模型在数学推理中的能力,发现模型对高频词语的推理更为准确,并探讨了多语种环境下的推理能力。通过设计训练数据和分析错误类型,提升了模型的自检能力。同时,研究揭示了数据污染对模型性能的影响,强调了严格评估推理过程的重要性,为未来数学推理能力的发展提供了方向。
完成下面两步后,将自动完成登录并继续当前操作。