BriefGPT - AI 论文速递 ·

Distil-xLSTM: Learning Attention Mechanisms through Recurrent Structures

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

本研究提出了一种新的xLSTM架构Distil-xLSTM，旨在解决自然语言处理领域中以Transformer模型为主导的问题。该架构通过从大型语言模型中提取知识进行训练，展现出计算和规模效率的优势，并能有效近似Transformer模型的注意力参数化。

🎯

🏷️

GPT-5.6 3款模型在Amazon Bedrock正式可用
亚马逊云科技宣布，GPT-5.6的三款模型（Sol、Terra、Luna）已在Amazon Bedrock上线。这些模型提升了智能与效率，支持开发者解决复...
colibri – 在 25GB 内存电脑上运行 GLM-5.2 (744B MoE)
Colibri 是一个开源项目，允许普通电脑在仅有 25GB 内存的情况下运行 GLM-5.2 模型，无需 GPU。它通过按需加载模型参数，节省内存和硬盘...
模型上新｜Qwen-Audio-3.0-Realtime 如何让语音交互“懂倾听，更聪明”？
阿里语音交互模型Qwen-Audio-3.0-Realtime实现了自然化与智能化的语音交互，具备动态调整语气、情感共鸣和多模态双工控制能力。该模型在复杂...
大规模直播：世界杯暴露了广告业的基础设施缺口
2026年世界杯将举行104场比赛，48支球队参赛，首次在三个国家同步直播。赛事转播权分散，广告投放需适应实时比赛动态，品牌需灵活调整营销策略，以应对观众...
英特尔 Vulkan 驱动现支持 H.265 10 位视频编码
Igalia 的 Hyunjun Ko 正在推进英特尔的开源 Vulkan 驱动 ANV，修复了 Alchemist GPU 的 H.264/H.265 ...
Weston 16.0 合成器发布，HDR 功能改进，Vulkan 问题修复
Weston 16.0 发布，新增对 Wayland 的 HDR 显示支持和色彩管理改进，增加灰度输出和颜色管线支持，支持 Linux 7.1 内核的背景...