每周编辑精选|COIG-CQIA 数据集上线、在线运行 ComfyUI 文生图工作流

💡 原文中文,约4100字,阅读约需10分钟。
📝

内容提要

中国科学院、零一万物、北京大学等10家机构联合开发了COIG-CQIA数据集,填补了高质量中文数据集的空白。该数据集中的“弱智贴吧”数据质量超过知乎、豆瓣等知识社区。COIG-CQIA数据集已上线hyper.ai官网。

🎯

关键要点

  • 中国科学院、零一万物、北京大学等10家机构联合开发了COIG-CQIA数据集。
  • COIG-CQIA数据集填补了高质量中文数据集的空白。
  • 该数据集中“弱智贴吧”的数据质量超过知乎、豆瓣等知识社区。
  • COIG-CQIA数据集已上线hyper.ai官网。
  • hyper.ai官网更新了10个优质公共数据集、2个优质教程和5篇社区文章。
  • COIG-CQIA是一个开源的高质量指令微调数据集,旨在为中文NLP社区提供支持。
  • EgoExoLearn数据集包含120小时的视频数据,来自日常生活和专业实验室。
  • S2S-SIM数据集支持船舶之间的有效协同感知,包含7000帧数据。
  • Common Corpus是规模最大的公共领域数据集,汇集5000亿词汇。
  • TriviaQA是一个包含超过65万个问答证据三元组的阅读理解数据集。
  • HalluQA数据集包含450个对抗性问题,涉及多个领域。
  • FineFake数据集用于细粒度多领域假新闻检测,包含16909个数据样本。
  • ComfyUI Stable Cascade教程可降低16倍成本,简化AI绘画流程。
  • 农作物病害图像分类教程帮助训练机器学习模型检测植物疾病。
  • 清华大学发布Uni-MOF模型,能有效识别三维空间构型。
  • 中山大学等联合构建卵巢癌诊断AI模型,准确率优于传统生物标志物。
  • 英矽智能在AI制药领域面临挑战,仍在寻求上市机会。
  • 热门百科词条包括浪链、混合专家模型等,提供AI相关知识。
  • HyperAI超神经致力于成为国内数据科学领域的基础设施,提供丰富资源。
➡️

继续阅读