大型语言模型的权重是历史的一部分

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

互联网内容逐渐消失，旧网页每年减少。互联网档案馆是现代历史的重要部分，但面临生存挑战。个人博客、科学论文和早期数字艺术等也在消失。尽管保存所有内容的努力可能失败，利用大型语言模型压缩信息是一种可行的解决方案。我们应支持互联网档案馆，并确保大型语言模型的权重不被遗失。

🎯

🔎

随着互联网内容的逐年消失，许多重要的历史资料也随之消失。个人博客、科学论文和早期数字艺术等都是记录时代的珍贵资产。保护这些内容不仅是对历史的尊重，也是对未来的责任。

互联网档案馆作为保存现代历史的重要机构，面临着资金和资源的双重挑战。尽管其价值不可估量，但缺乏经济支持使其生存变得困难。因此，公众的支持和关注显得尤为重要。

大型语言模型在信息压缩方面展现出一定的潜力，尽管其准确性和完整性存在不足。这种技术可以作为一种补充手段，但不能替代对原始内容的保护和保存。

❓

每年都有一部分旧网页消失，具体比例未提及。

互联网档案馆是现代历史的重要组成部分，帮助保存即将消失的内容。

因为这些努力往往缺乏经济效益，成本高而收益低。

大型语言模型能够压缩信息，尽管不够精确，但仍是一种可行的解决方案。

DeepSeek V3是一个提供互联网有损压缩视图的模型。

我们应努力支持互联网档案馆及类似机构，确保其存续。

🏷️