BriefGPT - AI 论文速递 ·

Flash Inference: Near Linear Time Inference for Long Convolution Sequence Models and Beyond

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本文提出了一种加速长卷积序列模型推断的方法，将时间复杂度降低至近线性 $O(L ext{log}^2L)$。实验结果显示，该方法在性能上显著提升，尤其在位置混合部分实现了 $50 imes$ 的改进。

🎯

🏷️

刚刚，Gemini 3.6 Flash 正式发布，但网友笑得更大声了
说好的 3.5 Pro 呢？#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
早报｜iPhone 20 Pro Max或搭载约7英寸屏幕/曝小米上调今年手机出货目标至1.1亿部/Gemini 3.6 Flash发布,输出Token减少17%
· 曝苹果正打样约 7 英寸屏幕，或用于 iPhone 20 Pro Max · 曝小米上调今年手机出货目标至 1.1 亿部 · 张一鸣向芳梅公益基金追加...
派早报：Google 推出 Gemini 3.6 Flash、Unity 7 引擎发布等
英伟达推出合成视频检测器 NIM、WordPress 曝出高危漏洞等。查看全文
谷歌Gemini 3.6 Flash发布：输出token暴降17%，价格战打到了七块五
谷歌AI模型更新引爆价格战，谁还敢说Flash系列只是“快枪手”？ Google一口气甩出三款新模型，直接把AI价格战打到了每百万token七块五毛钱，这...
What’s new: Air gets more agents, local models, and Java/Kotlin code intelligence
The new release of JetBrains Air brings support for GitHub Copilot, OpenCode,...
Introducing Gemini 3.6 Flash, 3.5 Flash-Lite, and 3.5 Flash Cyber
We’re introducing new Gemini models, including Gemini 3.6 Flash, 3.5 Flash-Li...