小红花·文摘

本研究解决了大语言模型（LLM）在预训练数据集组成和选择上的不透明性问题，并通过开源普适数据处理流程验证其有效性。BaichuanSEED模型在处理了3T个token后，在多个基准测试中展现出与先进的商业大语言模型相当的表现。此工作为大语言模型的训练和应用提供了新的思路和数据处理方法。

BriefGPT - AI 论文速递 ·

本研究提出了一种高效的人-物交互检测器（EHOI），通过两个阶段的处理结合错误纠正编码，解决了人-物交互检测中的计算复杂性和不透明性问题。实验结果表明，该方法在检测性能和复杂性平衡方面表现出色。

BriefGPT - AI 论文速递 ·