Fatescript ·

那些年，我们没想过的数值稳定算法

💡 原文中文，约14400字，阅读约需35分钟。

📝

内容提要

深度学习模型训练中，数值计算误差传播可能导致梯度爆炸或消失。本文探讨了提高数值稳定性的方法，包括重写数学公式、采用不同算法、提高计算精度和限制输入范围等策略，以增强计算结果的准确性和稳定性。

🎯

🏷️

从原始数值识别嵌入模型
嵌入向量中的数字模式显著影响生成模型和推理指令。我们训练了一个小型变换器分类器，准确率达到87%。可以实时演示，粘贴任意嵌入向量以查看分类结果。
布鲁斯·莫姆贾恩：新演讲
我一直想做关于预写日志（WAL）的演讲，随着Postgres对WAL功能的依赖增加，演讲内容逐渐丰富，最终形成了103张幻灯片。
NanoClaw可以将每个AI代理放入自己的Docker容器中，以应对OpenClaw的安全问题
机器人访问WhatsApp面临挑战。大多数OpenClaw用户使用WhatsApp，但没有商业账户无法创建新用户。WhatsApp连接依赖于Baileys...
扩展人类判断：Dropbox如何利用大型语言模型提升RAG系统的标注效率
Dropbox通过结合人类标注和大型语言模型（LLMs）生成的标签，提升了文档检索的相关性和标注效率。尽管LLM存在局限性，但人类校准显著改善了RAG系统的性能。
索尼似乎正在对PlayStation游戏进行动态定价测试
PSprices网站发现索尼数字游戏商店对不同用户的游戏价格存在差异，这些优惠通过PlayStation API中的实验标识符进行跟踪。
Rapidhash Unity 移植
十年前，我编写了非加密哈希函数。当时xxHash刚推出（2014年），之后更新为XXH3（2020年），出现了wyhash（2020年后），最终演变为ra...