小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

马斯克在法庭上承认其公司xAI蒸馏了OpenAI的模型,引发对AI行业竞争规则的讨论。法官质疑马斯克的动机,指出他一边担忧AI风险,一边创办AI公司。案件结果可能影响AI行业的未来,蒸馏技术的合法性和慈善信托的转型问题将被重新审视。

马斯克当庭承认蒸馏ChatGPT,AI行业最大的遮羞布被扯掉了

dotNET跨平台
dotNET跨平台 · 2026-05-06T00:01:13Z
Jeff Dean最新访谈:未来开发者人均50个智能体,写需求成核心技能

谷歌首席AI科学家Jeff Dean在访谈中预测,未来每位开发者将管理50个智能体,清晰的需求定义将成为核心技能。他强调智能体的输出质量依赖于需求的准确性。谷歌将推出高端和高性价比的模型,蒸馏技术是关键。低延迟将显著提升用户体验,未来模型将更加注重个性化和多模态能力。

Jeff Dean最新访谈:未来开发者人均50个智能体,写需求成核心技能

量子位
量子位 · 2026-03-10T07:27:34Z

SlimSpeech是一种轻量高效的文本到语音合成系统,基于精简整流流。该研究通过优化模型结构和蒸馏技术,显著减少了模型参数,同时保持了与大型模型相当的合成效果。

SlimSpeech: Lightweight and Efficient Text-to-Speech Synthesis Based on Slim Rectified Flow

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-10T00:00:00Z
爆火的DeepSeek引发成本、技术质疑,未来算力还重要吗?

DeepSeek因其低成本和高性能在AI领域备受关注,但其训练成本和技术引发争议。报告指出,DeepSeek的成本计算不全面,实际投入远高于预估,且关于是否使用蒸馏技术存在质疑。尽管表现优秀,业内认为算力需求可能仍会增加。

爆火的DeepSeek引发成本、技术质疑,未来算力还重要吗?

TechWeb 全站精华
TechWeb 全站精华 · 2025-02-10T05:20:43Z

李飞飞团队以不到150元的成本,训练出推理模型s1,耗时仅26分钟,性能媲美DeepSeek-R1和OpenAI o1。s1通过蒸馏技术和1000个精选问题数据集,在数学评测中表现优异,已在GitHub开源。

成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

量子位
量子位 · 2025-02-07T00:26:31Z
深度解读:DeepSeek-R1——强化学习如何重塑语言模型的推理能力?

DeepSeek发布的DeepSeek R1报告展示了一种通过纯强化学习提升大型语言模型推理能力的新方法。研究表明,模型能够在无监督数据下自我进化,显著提升数学和编程任务的表现。团队还利用蒸馏技术实现了小模型的高效迁移,推动了AI技术的普及。尽管取得了进展,未来仍需解决多语言支持和安全性等挑战。

深度解读:DeepSeek-R1——强化学习如何重塑语言模型的推理能力?

我爱自然语言处理
我爱自然语言处理 · 2025-01-22T10:17:27Z
GPT-5、 Opus 3.5为何迟迟不发?新猜想:已诞生,被蒸馏成小模型来卖

OpenAI 可能在内部开发 GPT-5,但尚未发布,以提高投资回报。Anthropic 的 Claude Opus 3.5 也未如预期推出,可能因性能不佳。两者通过蒸馏技术提升小型模型性能,降低推理成本。随着 AI 需求激增,实验室面临成本压力,可能选择保留更强大的模型用于内部优化,而非公开发布。

GPT-5、 Opus 3.5为何迟迟不发?新猜想:已诞生,被蒸馏成小模型来卖

机器之心
机器之心 · 2025-01-17T04:00:02Z

本研究提出了多种基于扩散模型的图像超分辨率方法,旨在提高采样质量和效率。新模型ACDMSR和YONOS-SR通过优化边界条件和蒸馏技术,显著提升了低分辨率图像的视觉效果。此外,研究引入了双阶段框架和时间感知蒸馏方法,解决了传统方法的延迟问题,实验结果显示新方法在多个基准测试中表现优越。

放大局部,扩散局外:面向极端图像超分辨率的局部降解感知多重扩散方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

大型语言模型(LLM)如ChatGPT和Claude因参数庞大需大量计算资源。LLM蒸馏技术通过将大模型知识转移到小模型中,提升效率并降低成本。尽管在自然语言处理和图像生成领域表现良好,但仍面临性能限制、数据需求和偏见传播等挑战。未来研究将致力于改进技术、扩展应用及解决伦理问题。

ChatGPT如何节省GPU时间?模型蒸馏的概念

DEV Community
DEV Community · 2024-10-12T11:34:40Z

本研究提出了一种新型蒸馏技术,利用凸优化压缩大型深度神经网络,适用于资源有限的边缘设备。该方法无需微调,并在数据稀缺情况下保持原始性能,提升了模型在边缘设备上的应用潜力。

Convex Distillation: Efficient Compression of Deep Networks through Convex Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z
ChatGPT擅长搜索排序吗?

这篇EMNLP2023论文研究了大语言模型在搜索排序中的表现,提出了一种直接输出段落排序组合的方案,并使用蒸馏技术将GPT-4的排序能力转移到更小的模型上。实验结果显示,GPT-4在TREC和BEIR数据集上表现优异,使用GPT-4对由ChatGPT重排序的段落进行重新排序的方法取得了良好结果。

ChatGPT擅长搜索排序吗?

Finisky Garden
Finisky Garden · 2024-07-21T14:15:25Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码