实时互动网 ·

Dimple：一种用于高效可控文本生成的离散扩散多模态语言模型

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

近年来，扩散模型在自然语言处理中的应用引起关注，发展出离散扩散语言模型（DLM）。DLM通过去噪生成文本，支持并行解码，提高生成速度和结构控制。新加坡国立大学的Dimple模型结合视觉编码器与扩散语言模型，采用自回归与扩散的两阶段训练，性能优于同规模自回归模型。

🎯

❓

Dimple模型结合了视觉编码器与离散扩散语言模型，采用自回归与扩散的两阶段训练方法，显著提高了推理效率和生成灵活性。

Dimple模型通过去噪生成文本，支持并行解码，并利用动态置信解码策略，根据预测置信度调整标记更新，从而提高生成速度和结构控制能力。

Dimple模型在基准测试中性能优于同规模自回归模型，提供了更快的生成速度和更好的结构控制能力。

Dimple模型采用两阶段训练方法，首先进行自回归训练以实现视觉-语言对齐，然后进行扩散训练以恢复生成能力。

Dimple模型在多模态理解任务中表现出强劲的性能，尽管在更大规模数据集上训练的模型表现更好，但其仍具竞争力。

Dimple模型通过引入自回归训练与扩散训练的结合，克服了纯扩散训练的不稳定性和性能问题。

🏷️

Christophe Pettus: On pgvectorscale, and Hybrid Search Without an Elasticsearch Sidecar
pgvector is excellent. It is also, at large scale, expensive — because the HN...
保罗·梅尔基奥雷：Posette 2026
An Event for Postgres (pronounced /Pō-zet/, and formerly called Citus Con) is...
OpenClaw v2026.4.29：从消息控制到记忆系统彻底进化
这一版主打三件事：让自动化对话更听话、让记忆系统更懂人、让底层基础设施更稳。五个板块一共塞了二十多项改进，从消息流转到安全扫描，从模型接入到网关修复，覆盖...
Roblox的日活跃用户持续下降，年龄检查减缓了增长
Roblox的日活跃用户在过去六个月减少了2000万，降至1.32亿，主要因实施年龄检查导致新用户增长放缓。尽管如此，Roblox的收入仍增长至14亿美元...
国会继续推迟监控改革
美国国会将《外国情报监视法》第702条延长45天，以便进行改革谈判。尽管有小幅改革，但未包含备受争议的搜查令要求，隐私倡导者对此表示失望。国会需在2026...
尽管面临芯片短缺，苹果iPhone收入跃升至570亿美元
苹果iPhone收入在过去几个月增长22%，达到570亿美元，尽管面临芯片短缺。CEO库克表示需求强劲，但供应链紧张。苹果第二季度收入达1112亿美元，创...