OpenAI推出新计划,旨在为法律、金融、医疗等特定领域设计AI基准,以改善模型评分,帮助团队在实际环境中评估模型表现。OpenAI希望与多家公司合作,创建行业特定的基准和评估。
Google DeepMind发布了新算法JEST,用于筛选AI训练数据集。JEST使用预训练模型评分数据批次的可学习性,实验证明JEST筛选的模型计算量比基准方法少10倍。JEST自动化筛选训练数据集,找到对学习模型而言损失高但对参考模型而言损失低的批次。研究团队发现JEST提高了批次质量。JEST使用模型近似进行高效评分,通过删除层或图像补丁提高效率。DeepMind团队多次实验证明JEST在相同性能下减少了10倍训练FLOPS。
完成下面两步后,将自动完成登录并继续当前操作。