@Lenciel ·

Nginx 挡爬虫

💡 原文中文，约5100字，阅读约需13分钟。

📝

内容提要

作者分享了维护个人网站的经验，探讨了AI爬虫对内容采集的影响。通过配置Nginx和使用robots.txt，限制不守规矩的爬虫访问，并记录封禁其IP，表达了对AI爬虫的不满。

🎯

❓

可以通过配置Nginx的robots.txt文件完全拒绝AI爬虫，并使用UA拦截和访问频率限制来进一步阻止不守规矩的爬虫。

robots.txt用于告知爬虫在访问网站时应遵循的规则，作者选择完全拒绝AI爬虫的访问。

作者对AI爬虫表示强烈不满，认为其对个人网站造成了困扰，影响了内容的共鸣。

可以使用Nginx的日志功能，将被阻止的爬虫访问记录到单独的日志文件中，并结合fail2ban进行IP封禁。

通过设置访问频率限制，可以区分人类用户和爬虫，限制爬虫的请求频率，从而减少其对网站的影响。

作者的网站主要服务于自己和家人，记录个人的想法和经历。

🏷️

Rocketium任命两位执行合伙人，推动AI Studio企业业务增长
（全球TMT2026年4月24日讯）Rocketium宣布任命Hitesh Mehta和Sharon Foo为 […]
海信最新高端电视产品UR9系列面向全球正式发布
（全球TMT2026年4月24日讯）4月23日，海信宣布其最新高端电视产品UR9系列面向全球正式发布。该系列通 […]
开赟与IBM合作推出内存资源优化方案
（全球TMT2026年4月24日讯）上海开赟数字技术有限公司与IBM合作，基于IBM Spectrum LSF […]
基于 AWS DevOps Agent 构建 AI 驱动的运维分析系统
随着企业在 AWS 上的工作负载日益复杂——EC2 集群、RDS 数据库、ECS/EKS 容器、Lambda 函数、网络与负载均衡等多种服务交织运行——运...
用 Kiro CLI 自动搭建 FluentBit 日志采集方案：两种 EKS 埋点数据落地 S3 Parquet 的实战对比
本文介绍了如何使用Kiro CLI和Amazon EKS MCP Server自动搭建FluentBit日志采集方案，并比较了两种将EKS埋点数据转存为S...
AI 驱动的跨云网络搭建：用 Claude Code 和 Kiro CLI 实现 AWS-腾讯云 IPSec VPN 双隧道互联
本文介绍了如何利用AI工具Claude Code和Kiro CLI快速搭建AWS与腾讯云之间的IPSec VPN双隧道互联。通过三种架构方案的迭代，展示了...