HyperAI超神经 ·

每周编辑精选｜COIG-CQIA 数据集上线、在线运行 ComfyUI 文生图工作流

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

中国科学院、零一万物、北京大学等10家机构联合开发了COIG-CQIA数据集，填补了高质量中文数据集的空白。该数据集中的“弱智贴吧”数据质量超过知乎、豆瓣等知识社区。COIG-CQIA数据集已上线hyper.ai官网。

🎯

关键要点

中国科学院、零一万物、北京大学等10家机构联合开发了COIG-CQIA数据集。
COIG-CQIA数据集填补了高质量中文数据集的空白。
该数据集中“弱智贴吧”的数据质量超过知乎、豆瓣等知识社区。
COIG-CQIA数据集已上线hyper.ai官网。
hyper.ai官网更新了10个优质公共数据集、2个优质教程和5篇社区文章。
COIG-CQIA是一个开源的高质量指令微调数据集，旨在为中文NLP社区提供支持。
EgoExoLearn数据集包含120小时的视频数据，来自日常生活和专业实验室。
S2S-SIM数据集支持船舶之间的有效协同感知，包含7000帧数据。
Common Corpus是规模最大的公共领域数据集，汇集5000亿词汇。
TriviaQA是一个包含超过65万个问答证据三元组的阅读理解数据集。
HalluQA数据集包含450个对抗性问题，涉及多个领域。
FineFake数据集用于细粒度多领域假新闻检测，包含16909个数据样本。
ComfyUI Stable Cascade教程可降低16倍成本，简化AI绘画流程。
农作物病害图像分类教程帮助训练机器学习模型检测植物疾病。
清华大学发布Uni-MOF模型，能有效识别三维空间构型。
中山大学等联合构建卵巢癌诊断AI模型，准确率优于传统生物标志物。
英矽智能在AI制药领域面临挑战，仍在寻求上市机会。
热门百科词条包括浪链、混合专家模型等，提供AI相关知识。
HyperAI超神经致力于成为国内数据科学领域的基础设施，提供丰富资源。

❓

延伸问答

COIG-CQIA数据集的开发背景是什么？

COIG-CQIA数据集由中国科学院、零一万物、北京大学等10家机构联合开发，旨在填补高质量中文数据集的空白。

COIG-CQIA数据集的质量如何？

该数据集中“弱智贴吧”的数据质量超过知乎、豆瓣等知识社区，显示出其高质量的特性。

COIG-CQIA数据集的主要用途是什么？

COIG-CQIA是一个开源的高质量指令微调数据集，旨在为中文NLP社区提供支持。

COIG-CQIA数据集在哪里可以访问？

COIG-CQIA数据集已上线hyper.ai官网，用户可以直接访问该网站获取数据集。

hyper.ai官网更新了哪些内容？

hyper.ai官网更新了10个优质公共数据集、2个优质教程和5篇社区文章。

有哪些其他重要的数据集与COIG-CQIA一起上线？

除了COIG-CQIA，还有EgoExoLearn、S2S-SIM、Common Corpus等多个重要数据集上线。

🏷️