2024 Meet AI Compiler 北京线下聚会定档!千万级指令微调数据集 InfinityInstruct 开源

💡 原文中文,约4600字,阅读约需11分钟。
📝

内容提要

北京智源人工智能研究院发布了千万级高质量指令微调数据集开源项目InfinityInstruct,包括基于开源数据集进行高质量筛选的数据和通过数据合成方法构造的高质量指令数据。该数据集可用于训练和优化大语言模型。此外,hyper.ai官网还更新了其他优质公共数据集和教程精选。

🎯

关键要点

  • 北京智源人工智能研究院发布了千万级高质量指令微调数据集开源项目InfinityInstruct。
  • 该数据集包括基于开源数据集筛选的数据和通过数据合成构造的高质量指令数据。
  • 首批300万条经过模型验证的中英文指令数据集InfInstruct-3M已上线hyper.ai官网。
  • hyper.ai官网更新了10个优质公共数据集和2个优质教程精选。
  • 公共数据集包括InfInstruct-3M、LooGLE、InternVid-Full等,涵盖多个领域。
  • 公共教程精选包括TripoSR模型Demo和LGM大型多视角高斯模型生成Demo。
  • 社区文章精选包括2024 Meet AI Compiler活动预告和苹果发布Apple Intelligence的报道。
  • 热门百科词条包括倒数排名融合RRF、掩码语言建模MLM等。
  • HyperAI超神经致力于成为国内数据科学领域的基础设施,提供丰富的公共资源。
🏷️

标签

➡️

继续阅读