小红花·文摘 - 小红花技术领袖俱乐部

OpenAI要降价？推理成本减半新招揭秘

OpenAI要降价？推理成本减半新招揭秘

极道 ·

大模型推理无损加速6.5倍！EAGLE-3碾压一切、延续Scaling Law能力

大模型推理无损加速6.5倍！EAGLE-3碾压一切、延续Scaling Law能力

机器之心 ·

NeurIPS 2024 | 水印与高效推理如何两全其美？最新理论：这做不到

NeurIPS 2024 | 水印与高效推理如何两全其美？最新理论：这做不到

机器之心 ·

speculative-sampling笔记

speculative-sampling笔记

plus studio ·