机器之心 ·

语言模型新范式：首个8B扩散大语言模型LLaDA发布，性能比肩LLaMA 3

💡 原文中文，约4800字，阅读约需12分钟。

📝

内容提要

LLaDA是一种新型语言生成模型，采用掩码扩散机制，突破了传统自回归模型的局限，展现出在可扩展性、上下文学习和指令遵循等方面的优越性。

🎯

❓

LLaDA模型采用掩码扩散机制，突破了传统自回归模型的局限，展现出在可扩展性、上下文学习和指令遵循等方面的优越性。

LLaDA在上下文学习和指令遵循能力上超越了LLaMA2，并与LLaMA3媲美，展现了强大的zero/few-shot学习能力。

LLaDA的预训练使用了2.3万亿tokens的数据，涵盖多种内容。

LLaDA通过双向的概率建模机制，有效克服了传统自回归模型在逆向推理任务中的局限。

LLaDA在多轮对话、数学题解和跨语言文本生成等实际应用中表现出色，能够生成流畅、合理的回答。

LLaDA的推断过程通过离散化的反向过程逐步恢复文本，从完全掩码的响应开始，逐步预测被掩码的tokens。

🏷️

大语言模型可解释性入门
文章讨论了大语言模型（LLM）的可解释性，强调动态评估的重要性。尽管LLM在AI领域取得了突破，其内部运作仍不透明。研究者提出了基于SMILE的框架，通过...
FlowDB: 性能超过RocksDB的时序数据库
FlowDB 是一款高性能的嵌入式时序存储引擎，基于 Rust 构建，专为时序数据和日志负载优化。它采用无锁序列号分配、锁外 WAL 预编码和双态 Mem...
早期基准测试数据显示英伟达RTX SPARK N1X芯片性能相当于苹果M3 MAX
英伟达RTX SPARK N1X芯片的早期基准测试显示，其性能与苹果M3 MAX相当。N1X拥有20个核心，而M3 MAX则为14个核心。尽管M3 MAX...
英伟达与联发科联手打造RTX Spark超级芯片：手机能效与PC性能的跨界融合
英伟达与联发科联合研发的全新RTX Spark超级芯片发布，旨在解决PC性能与功耗瓶颈。该芯片集成高效能CPU和GPU，提供1 PFLOP的AI算力，支持...
微软发布了Scout，这是一款基于OpenClaw构建的智能体
微软发布了Scout，一款基于OpenClaw的自主AI代理，能够在Microsoft 365中自动完成任务，如安排会议和管理日历。Scout标志着AI从...
《战神：劳菲》将登陆PS5
索尼在2026年6月的State of Play展示中宣布了新游戏《战神：劳菲》。玩家将控制角色Faye/Laufey，游戏风格与以往不同，强调魔法和空中...