小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
OpenAI再次指控DeepSeek违规“蒸馏”其模型

OpenAI指控中国初创公司DeepSeek违规使用“模型蒸馏”技术,复制其产品功能,并已向美国国会提交证据。尽管面临指控,DeepSeek凭借低成本研发出性能相当的竞争产品,市场表现依然强劲,成为OpenAI的主要竞争对手。

OpenAI再次指控DeepSeek违规“蒸馏”其模型

Jing Blog
Jing Blog · 2026-02-17T07:45:21Z
大模型蒸馏:小型快速AI的实用指南

大模型在基准测试中表现优异,但推理成本高。模型蒸馏通过知识转移压缩模型,既保持准确性又降低成本,适合边缘设备。本文介绍了蒸馏的原理、应用场景及与其他优化技术的结合,以提高LLM应用的效率和性能。

大模型蒸馏:小型快速AI的实用指南

Redis Blog
Redis Blog · 2026-02-11T00:00:00Z

阿里智能引擎团队推出新技术,5秒生成4张2K高清图,速度提升40倍。通过模型蒸馏解决细节模糊问题,提升生成质量。团队将持续优化并开源模型,与社区共同发展。

5秒出4张2K大图!阿里提出2步生成方案,拉爆AI生图进度条

量子位
量子位 · 2026-01-30T13:23:51Z
为什么模型蒸馏正在成为生产AI中最重要的技术

Nebius Token Factory的客户通过模型蒸馏技术提高搜索排名和语法纠正等任务的效率。该技术将大型模型的行为转移至小型模型,降低延迟和成本,同时保持准确性,越来越多地被行业采用,以实现高效的AI系统,满足经济稳定性需求。

为什么模型蒸馏正在成为生产AI中最重要的技术

KDnuggets
KDnuggets · 2025-12-09T18:02:15Z

阿里推出的6B图像生成模型Z-Image上线首日下载量达50万,表现优异,图像质量接近FLUX.2。Z-Image有三个版本,支持图像生成和编辑,具备强大的文本渲染和语义理解能力,得益于架构优化和模型蒸馏技术,实现了速度与质量的平衡。

6B文生图模型,上线即登顶抱抱脸

量子位
量子位 · 2025-12-01T08:59:22Z
如何优化语言模型大小以便部署

本文探讨了优化语言模型大小的策略,包括模型蒸馏、剪枝、层减少和模块化适应。蒸馏通过教师-学生模型训练小型模型,剪枝移除贡献最小的权重,层减少通过减少网络层数提高效率,模块化方法如LoRA简化模型适应。此外,权重级优化技术如量化和权重共享也被提及,以提高推理速度和减少内存占用。

如何优化语言模型大小以便部署

MachineLearningMastery.com
MachineLearningMastery.com · 2025-06-09T16:40:47Z

京东探索研究院在《Nature》期刊上发表研究,提出通过模型蒸馏、数据治理、训练优化和云边协同的方法,提升大模型训练和推理效率,推理效率提高30%,训练成本降低70%。该研究为企业提供高效的AI模型开发解决方案,支持快速转化通用模型为专业模型,促进AI应用落地。

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊

量子位
量子位 · 2025-05-21T04:06:53Z
DeepSeek-R1 API:推动人工智能发展的新力量

DeepSeek-R1是一款开源推理模型,专注于密集推理任务,表现优异。它采用思维链技术和模型蒸馏,提升了推理能力,适用于多种文本处理任务,为开发者提供强大支持,推动人工智能发展。

DeepSeek-R1 API:推动人工智能发展的新力量

APISpace
APISpace · 2025-04-02T05:50:46Z

苹果研究发现模型蒸馏中的Scaling Law,教师模型的强度并非越高越好。学生模型的性能受教师模型能力影响,存在一个转折点。研究还提供了资源分配建议,以优化蒸馏效果。

苹果发现模型蒸馏Scaling Law!教师模型并非越强越好

量子位
量子位 · 2025-02-14T08:16:06Z

Kiln框架实现全自动模型蒸馏,支持多平台和主流模型,注重隐私与数据可视化。医疗案例表明其高效生成合成数据并训练多个模型,显著降低成本和时间。未来AI系统将持续进化,Kiln提供全面的私有化部署解决方案。

企业AI私有化终极方案:DeepSeek-R1蒸馏实战全解析

dotNET跨平台
dotNET跨平台 · 2025-02-10T00:02:24Z
国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版

DeepSeek发布了DeepSeek-R1模型,性能与OpenAI o1相当,采用MIT授权,支持商业使用和模型蒸馏。该模型在数学、代码和自然语言推理等任务上表现优异,API服务定价合理。模型文件可在GitHub和HuggingFace下载,但本地运行需高配置硬件。

国产新模型 DeepSeek-R1 发布,MIT 授权,性能对标 OpenAI o1 正式版

小众软件
小众软件 · 2025-01-21T10:35:30Z

本研究提出了一种基于模型蒸馏的仇恨言论检测方法,解决了现有模型的可解释性问题。通过链式思维提取解释,蒸馏后的模型在分类性能上超过大型模型,为仇恨言论检测的经济性和可行性做出了贡献。

Efficient and Explainable Hate Speech Detection Based on Model Distillation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z
使用 Amazon Bedrock Model Distillation (预览版)构建更快、更具成本效益、高准确性的模型

今天,Amazon推出了Bedrock Model Distillation预览版,利用教师模型生成响应并微调小型学生模型,以提高准确性。该技术降低了延迟和成本,适用于特定场景,并支持多种模型。用户可在控制台创建蒸馏作业以优化模型性能。

使用 Amazon Bedrock Model Distillation (预览版)构建更快、更具成本效益、高准确性的模型

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-12-09T06:17:39Z

本研究提出了一种新框架,解决了三维头部风格化在保持人物身份方面的不足。通过负对数似然蒸馏,显著提升了身份保持和风格化质量,为三维头部风格化和模型蒸馏提供了新见解。

Identity Preserving 3D Head Stylization with Multiview Score Distillation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z
2024年OpenAI开发者日(旧金山)发布实时API、视觉微调等新功能

在2024年10月1日的OpenAI SF DevDay上,OpenAI发布了新功能,包括实时API、视觉微调、模型蒸馏和提示缓存。实时API支持WebSocket连接,实现实时语音交互。功能调用让AI执行超出预训练的任务。视觉微调和模型蒸馏API帮助在有限资源环境中部署AI。提示缓存减少延迟。OpenAI还强调了安全性和用户控制的重要性。

2024年OpenAI开发者日(旧金山)发布实时API、视觉微调等新功能

InfoQ
InfoQ · 2024-10-10T23:01:00Z
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜

在旧金山的第二届DevDay大会上,OpenAI没有推出新产品,而是改进了现有AI工具和API。发布了视觉微调、实时API、模型蒸馏和提示缓存四项新功能,旨在增强开发者能力。战略重点转向生态系统发展,降低AI使用成本,促进更多应用探索。

乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜

机器之心
机器之心 · 2024-10-02T03:37:53Z
API中的模型蒸馏

OpenAI推出新的模型蒸馏工具,简化开发者管理蒸馏流程。该工具自动生成数据集、创建评估和微调模型,帮助开发者更高效地利用前沿模型输出,提升小型模型性能并降低成本。

API中的模型蒸馏

OpenAI
OpenAI · 2024-10-01T10:02:00Z
深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

OpenAI发布了新模型OpenAI o1,价格是旧模型的100倍,能够进行系统2思考和推理复杂任务。o1的IQ测试成绩为120分,其他模型都在100分以下。模型的思维过程被隐藏起来,只通过摘要形式输出。隐藏思维过程有三个好处:保证模型发展智力,避免竞争对手发现有效策略,彻底杜绝模型蒸馏现象。但隐藏思维过程也带来了潜在风险,如权力集中、有害思想、学会撒谎。

深挖 OpenAI o1 :独立思考,智商超群,思维隐藏,一石三鸟...

橘子汽水铺
橘子汽水铺 · 2024-09-16T01:33:59Z

本文介绍了一种通过权重剪枝和模型蒸馏技术训练稀疏的预训练变压器语言模型,并使用量化感知训练将这些模型压缩为8位精度的新方法。实验证明,该方法在多种自然语言任务中传输知识,并且是目前最好的压缩BERT模型的方法。

LLM 外科医生

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-28T00:00:00Z

本研究将低秩适应性(LoRA)与模型蒸馏相结合,以压缩扩散模型。该方法显著减少了推理时间和内存消耗,且在质量方面没有妥协。生成图像的检查结果一致。

基于 LoRA 增强的导向扩散模型蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码