机器之心 ·

FBI-LLM低比特基础大语言模型来了，首个完全从头训练的二值化语言模型

💡 原文中文，约5600字，阅读约需14分钟。

📝

内容提要

本文介绍了一种名为FBI-LLM的新方法，用于训练二值化大语言模型。该方法使用自回归蒸馏从头开始训练二值化模型，性能接近全精度模型。作者通过实验证明了该方法的有效性，并展示了二值化模型在生成任务上的潜力。该方法可减少存储需求，提高计算速度和能源效率。

🎯

🏷️

WAF防线告急？绿盟科技已提前锁定“幽灵比特位”攻击
2026年Black Hat Asia大会揭示了“Ghost Bits”安全威胁，源于Java编码缺陷，导致WAF防护失效。攻击者利用字符编码不一致，构造...
AI sandboxing is having its Kubernetes moment
Recently, Anthropic announced that its new model, Mythos, had autonomously fo...
微软的Xbox模式现已在所有Windows 11 PC上可用
Microsoft is now rolling out its Xbox mode to all Windows 11 PCs. The new Xbo...
Meta威胁称，如果被迫进行“技术上不可行”的更改，将撤回其在新墨西哥州的应用程序
Meta says it may be forced to pull Facebook, Instagram, and WhatsApp from New...
通过《Saros》，Housemarque主张以不同的方式开发次世代游戏
It is generally frowned upon to care too much about appearances. We have a lo...
马斯克诉奥特曼案中迄今揭示的所有证据
马斯克与奥特曼的诉讼揭示了OpenAI早期的内部邮件和文件。马斯克指控奥特曼等人违反慈善信托，质疑OpenAI是否偏离了其造福全人类的初衷。邮件显示，马斯...