机器之心 ·

Llama-3不算真开源：今年10月，权威定义就要来了

💡 原文中文，约3100字，阅读约需8分钟。

📝

内容提要

开放源代码促进会（OSI）发布了对「开源 AI」的最新定义草案，旨在澄清科技领域中开源术语的模糊用法。草案要求「开源」AI模型必须提供详细的训练数据信息、全部源代码以及模型权重和参数。然而，草案并未要求公开原始训练数据，而是要求提供详细的元数据。这一定义可能对AI行业产生深远影响，推动大模型领域的技术创新。

🎯

关键要点

开放源代码促进会（OSI）发布了对「开源 AI」的最新定义草案，旨在澄清开源术语的模糊用法。
草案要求「开源」AI模型提供详细的训练数据信息、全部源代码以及模型权重和参数。
草案并未要求公开原始训练数据，而是要求提供详细的元数据。
OSI的定义可能对AI行业产生深远影响，推动大模型领域的技术创新。
开源技术的扩散与交流可能使开源大模型赶上业界顶尖水平。
OSI召集专家团队为「开源」下定义，提出「四项基本自由」。
OSI希望通过明确的标准，帮助开发者、研究人员和用户做出更明智的决策。
OSI的草案要求AI系统提供适合修改的形式，包括训练数据的详细信息和模型权重。
草案允许不公开训练数据，要求提供关于训练数据和方法的详细元数据。
OSI的定义可能影响公司发布AI模型的形式和未来的法规。
希望新的定义能够进一步推动大模型领域的技术创新。

❓

延伸问答

OSI对开源AI的最新定义草案包含哪些要求？

草案要求开源AI模型提供详细的训练数据信息、全部源代码以及模型权重和参数，但不强制公开原始训练数据，而是要求提供详细的元数据。

为什么Llama-3被认为不是真正的开源？

因为Meta对使用Llama系列模型设定了特定的许可限制，导致其不符合OSI的传统开源标准。

OSI的草案中提到的‘四项基本自由’是什么？

‘四项基本自由’包括不限制使用目的、允许深入研究、支持随意修改和自由分享模型。

OSI希望通过新的开源定义实现什么目标？

OSI希望通过明确的标准推动AI系统的透明度、促进紧密合作和无需许可的创新，从而使市场繁荣发展。

草案对训练数据的要求是什么？

草案要求提供关于训练数据和方法的详细元数据，而不是强制公开原始训练数据。

新的开源AI定义可能对行业产生什么影响？

新的定义可能影响公司发布AI模型的形式，并塑造未来的法规，推动技术创新。

🏷️

继续阅读

Valve表示准备在今年夏季推出Steam Machine
Valve宣布Steam Machine和Steam Frame VR头显将于今年夏季推出。由于内存和存储问题，发货时间从最初的2026年调整。Steam...
认识Kameirah，今年的Google涂鸦比赛冠军！
今年的Google涂鸦比赛中，华盛顿的高中生Kameirah获胜，她的作品《发之力：源自我们的皇冠》展示了黑人头发作为文化和身份的象征。Kameirah希...
今年最值得升级的生产力工具，可能是一整张 AI 工位
文章讨论了在AI工具普及背景下，如何有效利用这些工具提升工作效率。推荐使用Gemini和Kimi进行信息搜索，飞书与Obsidian进行知识管理，以及Pl...
存之有序，治之有矩——Agent 记忆系统的工程实践与演进
本文是"解决 Agentic AI 应用 Token 爆炸问题"系列的第三篇，系统讨论 Agent 记忆系统在生产环境的工程税:从写入纪律...
eBay拒绝游戏驿站560亿美元收购提案；OpenAI收购Tomoro并成立新实体；腾讯音乐完成收购喜马拉雅
(全球TMT2026年6月5日讯)OpenAI将收购咨询公司Tomoro；优步提议收购Delivery Her […]
基于220种海洋细菌，科学家用基因组尺度模型重构异养微生物分类体系，挖出8类代谢菌群
总的来说，本次研究跳出了沿用数十年的富营养型/寡营养型「二分法」框架，从基因与底物利用本质出发，建立了 8 类代谢生态位分类体系，打破了五种分类与生理功能...