小红花·文摘 - 小红花技术领袖俱乐部

在日常设备上实现隐私保护的人工智能训练

在日常设备上实现隐私保护的人工智能训练

MIT News - Artificial intelligence ·

ParaRNN：大规模非线性递归神经网络，可并行训练

ParaRNN：大规模非线性递归神经网络，可并行训练

Apple Machine Learning Research ·

全球最大规模含触觉数据集，凭什么吸引谷歌和众多高校的加入？

量子位 ·

MixAtlas：面向多模态大模型中期训练的基于不确定性的数据混合优化

MixAtlas：面向多模态大模型中期训练的基于不确定性的数据混合优化

Apple Machine Learning Research ·

SafetyPairs：通过反事实图像生成隔离安全关键图像特征

SafetyPairs：通过反事实图像生成隔离安全关键图像特征

Apple Machine Learning Research ·

马斯克下场点赞！Kimi 这篇论文撬动了大模型的「祖传地基」

马斯克下场点赞！Kimi 这篇论文撬动了大模型的「祖传地基」

爱范儿 ·

ReSyn：自动生成1000个推理环境，让AI学会真正的思考！

ReSyn：自动生成1000个推理环境，让AI学会真正的思考！

Micropaper ·

PaddleFormers驱动：最少国产算力完成DeepSeek-V3（671B）全参数微调实践

PaddleFormers驱动：最少国产算力完成DeepSeek-V3（671B）全参数微调实践

百度大脑 ·

何恺明团队新作GeoPT，全新预训练范式让模型自学真实物理规律

何恺明团队新作GeoPT，全新预训练范式让模型自学真实物理规律

量子位 ·

技能之夜：69,000+种智能代理变得更聪明的方式

技能之夜：69,000+种智能代理变得更聪明的方式

Vercel News ·

Oxygen 9N-LLM生成式推荐训练框架

Oxygen 9N-LLM生成式推荐训练框架

京东科技开发者 ·

Meta详细介绍了GEM广告模型，采用大规模LLM训练、混合并行和知识转移

Meta详细介绍了GEM广告模型，采用大规模LLM训练、混合并行和知识转移

InfoQ ·

RL 后训练进化论：从PPO被动奖励、GRPO组内奖励到DeepSeekMath-V2自验证奖励

RL 后训练进化论：从PPO被动奖励、GRPO组内奖励到DeepSeekMath-V2自验证奖励

逐水寻源 ·

清华与快手团队推出的SVG模型在训练效率上提升6200%，生成速度提升3500%。该模型通过构建语义与细节融合的特征空间，解决了VAE的语义纠缠问题，支持多任务通用，生成质量和效率显著优于传统方法。

VAE再被补刀！清华快手SVG扩散模型亮相，训练提效6200%，生成提速3500%

量子位 ·

Thinking Machine的新研究提出了一种名为在线策略蒸馏的方法，结合强化学习与微调，显著提高小模型的训练效率，减少训练步骤50-100倍，适合资源有限的个人和小公司。同时，该方法有效解决了AI的“灾难性遗忘”问题，支持模型的终身学习。

Thinking Machine新研究刷屏！结合RL+微调，小模型训练更具性价比

量子位 ·

DeepSeek-V3.2-Exp：用稀疏注意力实现更高效的长上下文推理

DeepSeek-V3.2-Exp：用稀疏注意力实现更高效的长上下文推理

我爱自然语言处理 ·

新智慧游戏与天禄电子竞技俱乐部签署战略合作协议，共同开发“专属AI教练”GameSkill，以提升职业战队的训练效率，助力备战国际赛事，推动电竞行业智能化升级。

AI教练GameSkill，首次助力职业战队备战国际电竞赛事

量子位 ·

参数与FLOPs：混合专家语言模型的最佳稀疏性扩展规律

参数与FLOPs：混合专家语言模型的最佳稀疏性扩展规律

Apple Machine Learning Research ·

阿里云的PAI-TurboX通过优化数据处理和算子，显著提高了自动驾驶模型的训练和推理效率，缩短了训练时间。

阿里云推出自动驾驶模型训练推理加速框架，训练时间可缩短50%

量子位 ·

基于 LLamaFactory 和 EasyR1 打造一站式无代码大模型强化学习和部署平台 LLM Model Hub

基于 LLamaFactory 和 EasyR1 打造一站式无代码大模型强化学习和部署平台 LLM Model Hub

亚马逊AWS官方博客 ·