每周编辑精选|MathPile 数学推理语料库开源、协和眼科牵头用 AI 助力 13 种眼底疾病检测

💡 原文中文,约3100字,阅读约需8分钟。
📝

内容提要

上海交通大学生成式人工智能研究实验室开源了数学领域的高质量预训练数据集MathPile和商用版本MathPile-Commercial,还有其他热门数学数据集可供下载。此外,还有AI生成的图像数据集、多样化肖像数据集、中文文本分类数据集等。另外,还有关于眼科疾病检测、工作场所绿化水平与健康关联、智能化科学设施构想等的论文案例。

🎯

关键要点

  • 上海交通大学生成式人工智能研究实验室开源了高质量数学预训练数据集MathPile和商用版本MathPile-Commercial。
  • MathPile数据集包含约95亿tokens,旨在提升大模型在数学推理方面的能力。
  • AI生成的图像数据集包含19张男孩图像,适用于面部和姿势检测任务。
  • 多样化肖像数据集包含140张高质量图像,展示了AI在模仿人类外表方面的能力。
  • THUCNews中文文本分类数据集包含74万篇新闻文档,涵盖14个分类类别。
  • ShareGPT 90k中英文双语人机问答数据集可用于训练高质量对话模型。
  • SMP-2017中文对话意图识别数据集促进中文人机对话系统研究。
  • 今日头条文本分类数据集包含382,688条短文本,涵盖15个分类。
  • 眼科疾病检测研究利用深度学习提高诊断一致性,相关论文发表于Nature期刊。
  • 研究表明工作场所绿化水平与健康有益关联,相关成果发表于Environment International期刊。
  • 上海交大AI4S团队提出智能化科学设施构想,相关研究成果发表于中国科学院院刊。
  • 亚马逊工程师汇总超40篇LLM论文,帮助快速检索高价值论文。
  • HyperAI超神经致力于成为国内数据科学领域的基础设施,提供丰富的公共资源。
➡️

继续阅读