还是全是 Zeno 。
过去五周专注于Zeno项目,进行了代码重构、日志彩色化和CSS解析器的引入。同时,利用TF-IDF分类器识别并标记了xLog上的垃圾文章账号,并改善了GitHub页面的存档效果,增加了存档功能。
STWP 2025 第 11 周周报 无事。 STWP 2025 第 12 周周报 整两个小活: STWP 2 … Continue reading "STWP 2025 第 11-19 周合并周报"
STWP 2025 第 4 周周报 STWP 2025 第 5 周周报 STWP 2025 第 6 周周报 S … Continue reading "STWP 2025 第 4-10 周合并周报"
STWP 2024 周报总结了多个项目进展,包括阶段目标完成、MongoDB 数据库回滚、申请 CloudFlare 认证、Bilibili 字幕投毒问题及 AcFun 视频下载器开发。小鸡词典宣布解散,STWP 将在接下来的三周放假。
本周,IA即使在宕机状态下也将举办“Escaping the Memory Hole”活动,讨论数字文化的保存。同时,WordPress Foundation向IA捐款十万美元。STWP项目进展顺利,完成数据库迁移并设定新适配目标网站。此外,pypi包下载量激增,发现DNS请求超时原因,并探索新的时间同步方法HTP。
一群业余 Web Archivist 的小型公益社团为知识保存作出贡献。
第 15 周项目摘要 尝试联系 wikiteam bot 的原所有者无果,于是在 wikiapiary 上部署了我们的 savewebbot 。 准备/宣传 第一届存档马拉松活动(主题是 DokuWiki 存档)。 给 savewebbot 开了 10 线程,wikiapiary 管理员说 bot 编辑页面频率太猛。于是加上1分钟编辑一次的限制。 原来的 wikiteam bot...
为了 STWP 不长期咕咕咕🌚,我们将每周发布项目进展简讯。 第 14 周项目摘要。 @jsun969 在尝试给 uglysearch.othing.xyz 写前端:https://github.com/saveweb/saveweb-search-frontend saveweb/review-2022 收录...
从今天(2022-07-18)开始, saveweb/rss-list 中收录的约 1200 多个博客(不包含被隐藏的博客)的新文章都会被每日自动推送到 Internet Archive 的 Save Page Now 存档。 同时(2022-07-19),我们也给「十年之约」的 RSS 系统中收录的博客(估计有 500 个以上)也整上了新文章每日推送到 Internet Archive...
STWP 关于内部 CRM 收集站长联系信息的披露…
完成下面两步后,将自动完成登录并继续当前操作。