Reddit发现AI公司利用Wayback Machine绕过数据限制,非法抓取历史数据进行模型训练,侵犯用户隐私。尽管Reddit已限制API和数据抓取,AI公司仍通过缓存等方式获取数据,导致与Wayback Machine的合作关系面临挑战,数据所有权与AI训练需求的冲突加剧。
Wayback Machine是一个记录互联网发展的存档网站,可以浏览过去的网页。对于个人来说,它是一个记录自己网站的痕迹的地方。对于消失的网站来说,它也可以被看作是墓志铭。无论从什么时代开始接触互联网,都能从这个网站上找到惊喜。
近期,《The Verge》和Decoder频道讨论网络的未来,大量网络内容消失成问题。皮尤研究发现2013年38%链接无法访问,称之为“数字腐烂”。然而,互联网档案馆是我们对抗链接失效的最佳防御,通过Wayback Machine可以查看网站的快照。
本文介绍了保存和展示作品的几种方法:Wayback Machine可以保存网页副本,Authory可以备份和展示作品,Journo Portfolio可以创建漂亮的作品展示网站,Conifer可以保存可点击的“会话”。这些方法都有免费和付费选项。
完成下面两步后,将自动完成登录并继续当前操作。