每周编辑精选|COIG-CQIA 数据集上线、在线运行 ComfyUI 文生图工作流
内容提要
中国科学院、零一万物、北京大学等10家机构联合开发了COIG-CQIA数据集,填补了高质量中文数据集的空白。该数据集中的“弱智贴吧”数据质量超过知乎、豆瓣等知识社区。COIG-CQIA数据集已上线hyper.ai官网。
关键要点
-
中国科学院、零一万物、北京大学等10家机构联合开发了COIG-CQIA数据集。
-
COIG-CQIA数据集填补了高质量中文数据集的空白。
-
该数据集中“弱智贴吧”的数据质量超过知乎、豆瓣等知识社区。
-
COIG-CQIA数据集已上线hyper.ai官网。
-
hyper.ai官网更新了10个优质公共数据集、2个优质教程和5篇社区文章。
-
COIG-CQIA是一个开源的高质量指令微调数据集,旨在为中文NLP社区提供支持。
-
EgoExoLearn数据集包含120小时的视频数据,来自日常生活和专业实验室。
-
S2S-SIM数据集支持船舶之间的有效协同感知,包含7000帧数据。
-
Common Corpus是规模最大的公共领域数据集,汇集5000亿词汇。
-
TriviaQA是一个包含超过65万个问答证据三元组的阅读理解数据集。
-
HalluQA数据集包含450个对抗性问题,涉及多个领域。
-
FineFake数据集用于细粒度多领域假新闻检测,包含16909个数据样本。
-
ComfyUI Stable Cascade教程可降低16倍成本,简化AI绘画流程。
-
农作物病害图像分类教程帮助训练机器学习模型检测植物疾病。
-
清华大学发布Uni-MOF模型,能有效识别三维空间构型。
-
中山大学等联合构建卵巢癌诊断AI模型,准确率优于传统生物标志物。
-
英矽智能在AI制药领域面临挑战,仍在寻求上市机会。
-
热门百科词条包括浪链、混合专家模型等,提供AI相关知识。
-
HyperAI超神经致力于成为国内数据科学领域的基础设施,提供丰富资源。
延伸问答
COIG-CQIA数据集的开发背景是什么?
COIG-CQIA数据集由中国科学院、零一万物、北京大学等10家机构联合开发,旨在填补高质量中文数据集的空白。
COIG-CQIA数据集的质量如何?
该数据集中“弱智贴吧”的数据质量超过知乎、豆瓣等知识社区,显示出其高质量的特性。
COIG-CQIA数据集的主要用途是什么?
COIG-CQIA是一个开源的高质量指令微调数据集,旨在为中文NLP社区提供支持。
COIG-CQIA数据集在哪里可以访问?
COIG-CQIA数据集已上线hyper.ai官网,用户可以直接访问该网站获取数据集。
hyper.ai官网更新了哪些内容?
hyper.ai官网更新了10个优质公共数据集、2个优质教程和5篇社区文章。
有哪些其他重要的数据集与COIG-CQIA一起上线?
除了COIG-CQIA,还有EgoExoLearn、S2S-SIM、Common Corpus等多个重要数据集上线。