本研究提出了Mixtera数据平面,解决了训练数据集增长带来的样本管理问题。用户可以声明性地指定样本的使用比例和顺序,Mixtera在不影响训练效率的情况下,支持数据混合策略,显著提升模型训练准确性。
完成下面两步后,将自动完成登录并继续当前操作。