小红花·文摘 - 小红花技术领袖俱乐部

DeepSeek V4四大工程突破：极低成本重塑行业格局与推理效率

DeepSeek V4四大工程突破：极低成本重塑行业格局与推理效率

极道 ·

视频生成推理加速实践：基于全局时间索引的序列并行 3D 位置编码优化

视频生成推理加速实践：基于全局时间索引的序列并行 3D 位置编码优化

实时互动网 ·

新的计算优化型 Amazon EC2 C8i 和 C8i-flex 实例简介

新的计算优化型 Amazon EC2 C8i 和 C8i-flex 实例简介

亚马逊AWS官方博客 ·

本研究提出了一种新的结构化剪枝框架SPAP，旨在优化大型语言模型的计算和内存需求。SPAP通过混合整数优化和交替最小化算法，解决了性能下降和微调成本高的问题，实验证明其在推理速度和内存效率上优于现有方法。

SPAP：通过交替优化和惩罚方法进行结构化剪枝

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，将测试时的计算优化视为元强化学习问题。通过引入累积遗憾的概念，研究表明最大化稠密奖励可以提高计算效率，实现2-3倍的性能提升和1.5倍的令牌效率提升，从而显著改善大型语言模型的推理表现。

Optimizing Test-Time Computation via Meta Reinforcement Fine-Tuning

BriefGPT - AI 论文速递 ·

EC2实例类型及其使用案例

EC2实例类型及其使用案例

DEV Community ·

🚀 AWS EC2 实例类型完整指南

🚀 AWS EC2 实例类型完整指南

DEV Community ·

谷歌DeepMind的最新研究发现，计算优化方法比扩展模型参数更经济有效。研究团队探究了基于过程的密集验证器奖励模型和根据prompt自适应更新模型的响应分布。团队提出了“计算最优”扩展策略，能够在使用少4倍测试计算资源的情况下超越其他方法。

小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

量子位 ·