小红花·文摘

该论文介绍了一种名为Convolutional KANs的创新卷积神经网络替代方法，通过将非线性激活函数集成到卷积中，准确性与标准卷积神经网络相当，但参数量减少一半，为神经网络架构优化提供新途径。

BriefGPT - AI 论文速递 ·

大型言语模型（LLM）取得突破性进展，混合专家模型（MoE）应运而生。DeepSeek-V2-Lite是轻量级的MoE模型，参数量减少近10倍，但功能不减。该模型在多个基准测试中表现优异，适用于低资源场景和高效推理。MoE模型研讨取得重大进展，为人工智能带来更多可能性。

六虎 ·