小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了开源许可证在非代码资产(如文档、数据和模型权重)中的应用,尤其是在大规模语言模型和生成式AI背景下。传统软件许可证(如MIT、Apache)已无法满足这些资产的需求。文章分析了Creative Commons、开放数据库许可证和OpenRAIL等不同类型的许可证,强调选择合适许可证的重要性,以确保合法合规并促进资源的有效使用。

【开源许可与版权工程】文档、数据、模型的许可:CC、ODbL、OpenRAIL、LLaMA 协议

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
再见,Llama。

Meta推出的新一代大模型Muse Spark强调闭源策略,未提供开源链接,显示其开源立场的转变。与Llama系列相比,Muse Spark在性能上处于第一梯队,但未来的开源计划尚不明确,开发者面临不确定性。

再见,Llama。

dotNET跨平台
dotNET跨平台 · 2026-04-10T00:02:22Z
英特尔发布 OpenVINO 2026.1,新增 Llama.cpp 后端支持和硬件支持

英特尔发布了OpenVINO工具包的2026.1版本,新增对Qwen3 VL模型和GPT-OSS 120B的支持,优化了跨Intel CPU、GPU和NPU的推理,支持Wildcat Lake SoC和Intel Arc Pro B70显卡。

英特尔发布 OpenVINO 2026.1,新增 Llama.cpp 后端支持和硬件支持

实时互动网
实时互动网 · 2026-04-09T01:52:28Z
Runpod报告:Qwen已超越Meta的Llama,成为最常部署的自托管LLM

Runpod的AI报告显示,Qwen是最常部署的自托管LLM,而Llama 4几乎没有被采用。视频生成服务如Synthesia和Runway的应用表明,优化工作负载比单次生成更为重要。整体来看,AI基础设施的使用模式趋向于性能和效率的整合。

Runpod报告:Qwen已超越Meta的Llama,成为最常部署的自托管LLM

The New Stack
The New Stack · 2026-03-12T13:00:57Z
在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

开源模型迭代迅速,开发者希望低门槛部署新模型,但GPU成本和环境配置仍是障碍。HyperAI提供免费CPU配额和在线教程,帮助开发者快速体验模型。

在线教程丨免费CPU资源快速部署,覆盖Qwen3.5/DeepSeek-R1/Gemma 3/Llama 3.2等热门开源模型

HyperAI超神经
HyperAI超神经 · 2026-03-10T03:46:25Z
清华数学系大神跳槽OpenAI!曾主导SAM与Llama开发,Sora负责人:欢迎加入

清华大学数学系的张鹏川宣布加入OpenAI,专注于世界模拟与机器人学研究。他曾在Meta主导SAM与Llama项目,推动计算机视觉与多模态智能的发展。此举被视为OpenAI在“世界模型 + 物理智能”领域的重要布局。

清华数学系大神跳槽OpenAI!曾主导SAM与Llama开发,Sora负责人:欢迎加入

量子位
量子位 · 2026-02-25T05:01:38Z
Meta新模型要来了,但Llama 4的锅谁来接?1300多位作者的联合报告来了

抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

Meta新模型要来了,但Llama 4的锅谁来接?1300多位作者的联合报告来了

机器之心
机器之心 · 2026-01-22T08:53:00Z
即将离职的Meta首席AI科学家承认该公司在发布Llama 4时篡改测试结果以获得最佳成绩

Meta首席AI科学家Yann LeCun承认,该公司在发布Llama 4时篡改基准测试结果,导致模型表现不佳,引发扎克伯格不满,整个GenAI团队被边缘化。

即将离职的Meta首席AI科学家承认该公司在发布Llama 4时篡改测试结果以获得最佳成绩

蓝点网
蓝点网 · 2026-01-03T03:45:02Z
开源生态再扩容!LLaMA-Factory正式支持ERNIE-4.5全系列,实战单卡微调宝可梦图鉴

文心大模型与LLaMA-Factory合作,支持ERNIE-4.5模型的微调。用户可通过简化流程和4-bit量化训练快速完成微调。案例展示了宝可梦角色识别任务,训练效果显著提升,模型适应性增强。

开源生态再扩容!LLaMA-Factory正式支持ERNIE-4.5全系列,实战单卡微调宝可梦图鉴

百度大脑
百度大脑 · 2025-12-29T11:55:56Z
在本地GPU上预训练Llama模型

本文介绍了如何在本地GPU上预训练Llama模型,包括训练特定标记的分词器、准备训练数据和执行预训练。使用HuggingFaceFW/fineweb数据集,创建一个12层的Llama模型,并设置训练参数以实现模型训练。

在本地GPU上预训练Llama模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-22T04:27:38Z
如何在自己的数据集上微调本地Mistral或Llama 3模型

本文介绍了如何使用Unsloth和QLoRA微调开源大语言模型,以提升客户支持效率。内容包括数据集准备、训练、测试和比较。通过微调,模型在特定领域的响应速度和一致性显著提高。教程涵盖Colab环境设置、数据集准备、模型训练及性能评估等步骤。

如何在自己的数据集上微调本地Mistral或Llama 3模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-19T09:00:17Z
构建Llama或GPT模型进行下一个标记预测

自然语言生成(NLG)面临挑战,现代解码器模型如Llama和GPT在大量文本数据上训练有效。本文介绍了如何构建Llama或GPT模型进行下一个标记预测,包括模型架构、预训练和变体。Llama模型采用分组查询注意力和旋转位置嵌入,使用SwiGLU激活函数,形成简单高效的语言模型。

构建Llama或GPT模型进行下一个标记预测

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-08T18:04:12Z
为Llama模型训练分词器

Llama模型是Meta发布的一个大型语言模型,采用字节对编码(BPE)进行文本分词,帮助模型理解词义关系。文章介绍了如何使用Hugging Face、SentencePiece和tiktoken库训练BPE分词器,并提供了代码示例。

为Llama模型训练分词器

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-05T17:48:42Z
独家揭秘Meta AI大裁员:Llama 4落后DeepSeek的恐慌

Meta AI部门裁员约600人,基础研究受损。新主管亚历山大·王重组团队,聚焦TBD Lab,因Llama 4表现不佳,扎克伯格感受到竞争压力,急于调整战略。

独家揭秘Meta AI大裁员:Llama 4落后DeepSeek的恐慌

TechWeb 全站精华
TechWeb 全站精华 · 2025-10-27T02:13:17Z

田渊栋在Meta裁员后迅速找到新工作,裁员涉及约600人,因Llama 4表现不佳。Meta裁员旨在提升团队效率,部分员工获得遣散费。田渊栋受到多个AI公司的青睐,显示他机会众多。

田渊栋被裁后新offer排到法国!原来Llama 4.5训完后被卸磨杀驴了

量子位
量子位 · 2025-10-24T01:21:49Z
智能抢票助手:基于 Python 的大麦网自动购票脚本 | 开源日报 No.753

ticket-purchase 是一个基于 Python 和 Selenium 的自动抢票脚本,支持多维度筛选和用户自定义配置。namada-trusted-setup-claimer 是用于安全签署消息的命令行工具。Optimum-NVIDIA 提升 LLaMA 2 的推理速度,兼容多种 NVIDIA GPU。kawaii-gcc 使 GCC 输出信息更生动,支持多语言。create_llama_projects 用于展示与 Llama 相关的项目。

智能抢票助手:基于 Python 的大麦网自动购票脚本 | 开源日报 No.753

开源服务指南
开源服务指南 · 2025-10-09T07:35:52Z

本文记录了微调Qwen3模型的过程,包括环境搭建、数据准备、模型训练和测试。通过curl命令验证了微调效果,显示工具链日益成熟,操作简便。

使用 LLaMA-Factory 微调 Qwen3 模型

陈少文的博客
陈少文的博客 · 2025-09-21T00:00:00Z
Llama.cpp 和 GGUF 中的多模态嵌入

jina-embeddings-v4推出了先进的多模态嵌入,支持文本、图像和复杂文档的向量搜索。通过修改llama.cpp,实现了多模态嵌入的生成,解决了图像处理和注意力机制的问题。调试后,llama.cpp模型的嵌入结果与参考模型相近,未来可优化视觉编码器和支持多向量嵌入。

Llama.cpp 和 GGUF 中的多模态嵌入

Jina AI
Jina AI · 2025-09-09T23:33:16Z
疯狂抢人 vs 闪电离职:Meta AI团队为何刚组建就内乱不断?两个月上演的收购神话与破灭 — Meta AI 战略、AI 模型、Scale AI、扎克伯格、Llama

Meta在AI领域的并购整合面临挑战,ScaleAI高管频繁离职,数据质量问题突出,竞争对手产品广泛应用。尽管进行高调并购,内部管理混乱,未来成功概率低,可能导致局面混乱。

疯狂抢人 vs 闪电离职:Meta AI团队为何刚组建就内乱不断?两个月上演的收购神话与破灭 — Meta AI 战略、AI 模型、Scale AI、扎克伯格、Llama

硕鼠的博客站
硕鼠的博客站 · 2025-09-03T00:46:30Z
如何在单台服务器上使用Llama-Swap本地运行多个大型语言模型

Llama-Swap是一个轻量级开源代理服务器,允许用户在本地轻松切换多个大型语言模型(LLM)。它通过监听API请求,自动管理模型服务器,简化了模型管理。用户只需配置YAML文件,即可在一台机器上运行多个模型,提高资源利用率和灵活性。

如何在单台服务器上使用Llama-Swap本地运行多个大型语言模型

KDnuggets
KDnuggets · 2025-08-27T12:00:18Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码