DeepSeek 的闪电索引器通过计算索引分数提高模型效率,解决了全书阅读的 $O(L^2)$ 复杂度问题。它筛选出与当前查询相关的 Top-k token,将注意力复杂度降低到 $O(L k)$,显著提升计算效率。
完成下面两步后,将自动完成登录并继续当前操作。