STWP 2025 第 20-25 周合并周报

💡 原文中文,约1200字,阅读约需3分钟。
📝

内容提要

过去五周专注于Zeno项目,进行了代码重构、日志彩色化和CSS解析器的引入。同时,利用TF-IDF分类器识别并标记了xLog上的垃圾文章账号,并改善了GitHub页面的存档效果,增加了存档功能。

🎯

关键要点

  • 过去五周专注于Zeno项目,没有进行其他存档项目。
  • 第20-21周对Zeno处理对象存储的代码进行了重构,添加了解析Azure Blob的能力。
  • 第20-21周让Zeno终端输出的日志变为彩色。
  • 第23周引入了标准CSS解析器,替换了原本的正则提取方式。
  • 第25周发现xLog上有一半的新文章是垃圾文章,使用TF-IDF分类器识别并标记了垃圾账号。
  • 第25周支持提取CSS的@import链接,并完整支持解析HTML嵌入和引用的CSS资源。
  • 第25周发现上游的CSS解析器不支持CSS Nesting和现代CSS语法,写了更鲁棒的正则作为备用解析器。
  • 在调试CSS过程中发现VSC自带的CSS高亮未适配新语法标准,并提交了PR。
  • 改善了对GitHub Issue页面的存档效果,向Zeno添加了Headless/Headfull存档功能。

延伸问答

Zeno项目在过去五周的主要进展是什么?

Zeno项目进行了代码重构、日志彩色化和CSS解析器的引入,同时改善了GitHub页面的存档效果。

在第20-21周,Zeno项目做了哪些具体的改动?

在第20-21周,Zeno项目重构了处理对象存储的代码,并添加了解析Azure Blob的能力,同时让终端输出的日志变为彩色。

TF-IDF分类器在xLog项目中是如何应用的?

TF-IDF分类器被用来识别并标记xLog上的垃圾文章账号,发现一半的新文章是垃圾文章。

Zeno项目引入标准CSS解析器的原因是什么?

引入标准CSS解析器是为了替换原本容易产生误报的简陋正则提取方式,提高解析的准确性。

在第25周,Zeno项目对CSS的支持有哪些新功能?

第25周,Zeno项目支持提取CSS的@import链接,并完整支持解析HTML嵌入和引用的CSS资源。

Zeno项目在调试CSS时发现了什么问题?

在调试CSS过程中,发现VSC自带的CSS高亮未适配新语法标准,并提交了PR进行修复。

➡️

继续阅读