小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
已婚4周年,屏蔽了爬虫却没屏蔽掉沮丧:阿小信的自由职业周记(2026W23)

本文讲述了作者作为自由职业者的焦虑与挑战。尽管在技术上取得了一些进展,如优化代码和开发广告拦截检测功能,但收入依然低迷,作者感到迷茫。尽管面临困难,作者决定坚持自己的道路,努力开发产品,希望未来能有所收获。

已婚4周年,屏蔽了爬虫却没屏蔽掉沮丧:阿小信的自由职业周记(2026W23)

人言兑
人言兑 · 2026-06-08T08:33:49Z
浏览器指纹与反爬虫:TLS JA3、HTTP/2指纹原理及绕过方法

本文讨论了数据抓取中的反爬虫技术,重点介绍了浏览器指纹,包括TLS指纹和HTTP/2指纹。通过分析请求头、TLS握手和HTTP/2设置,服务器能够识别客户端类型。为绕过检测,可以使用模拟浏览器指纹的库或真实浏览器自动化工具。文章强调了指纹检测的复杂性及其在爬虫识别中的重要性。

浏览器指纹与反爬虫:TLS JA3、HTTP/2指纹原理及绕过方法

人言兑
人言兑 · 2026-06-03T12:01:32Z
一款基于.NET开源的爬虫库,小白也能直接上手,简单、全能,高效

这是一款基于.NET的开源爬虫库,简化了数据抓取过程,适配多个主流平台,支持动态模型抓取和RESTful接口,具备多种缓存策略和代理池功能,降低IP封禁风险,使用简单,学习成本低,适合快速集成和数据分析。

一款基于.NET开源的爬虫库,小白也能直接上手,简单、全能,高效

dotNET跨平台
dotNET跨平台 · 2026-05-08T00:02:16Z

Cloudflare推出了“AI训练重定向”功能,通过将规范标签转化为301重定向,确保AI爬虫访问最新内容,改善AI生成答案的质量。用户可在Cloudflare仪表盘中轻松启用此功能。

AI训练重定向强制执行规范内容

The Cloudflare Blog
The Cloudflare Blog · 2026-04-17T13:00:00Z

由于百度爬虫无节制抓取博客园,导致其流量被封杀,博客园面临生存困境,原创内容质量下降,内容生态受到冲击,提醒程序员关注优质技术内容。

百度为什么封杀博客园:一场技术社区与搜索引擎的流量战争

dotNET跨平台
dotNET跨平台 · 2026-02-24T00:01:38Z
推荐一个基于 .NET 的开箱即用的多平台爬虫库

Aneiang.Pa是一个基于.NET的爬虫库,支持快速抓取热榜和垂直领域数据,涵盖多个主流平台。它提供代理池功能以降低IP封禁风险,并支持动态爬虫和自定义数据采集。该项目仅供学习和研究,需遵守相关法律法规。

推荐一个基于 .NET 的开箱即用的多平台爬虫库

dotNET跨平台
dotNET跨平台 · 2026-01-22T23:55:30Z
如果网站没有robots.txt文件 谷歌搜索会直接清除网站所有搜索结果

如果网站没有 robots.txt 文件,谷歌搜索将删除所有搜索结果。谷歌爬虫会检查该文件,若不存在则视为拒绝抓取,已收录的内容也会被清除。站长应定期检查网站流量和 robots.txt 状态。

如果网站没有robots.txt文件 谷歌搜索会直接清除网站所有搜索结果

蓝点网
蓝点网 · 2026-01-20T13:04:36Z
Nginx 挡爬虫

作者分享了维护个人网站的经验,探讨了AI爬虫对内容采集的影响。通过配置Nginx和使用robots.txt,限制不守规矩的爬虫访问,并记录封禁其IP,表达了对AI爬虫的不满。

Nginx 挡爬虫

@Lenciel
@Lenciel · 2026-01-06T16:23:49Z
推荐一个基于 C# 开发的高性能、可扩展的 Web 爬虫框架

Abot是一个高性能、可扩展的开源C#网页爬虫框架,设计灵活,支持多线程和高吞吐,适合长期维护的项目,易于定制,适用于数据采集和站点分析。

推荐一个基于 C# 开发的高性能、可扩展的 Web 爬虫框架

dotNET跨平台
dotNET跨平台 · 2026-01-04T00:02:15Z
Cloudflare年度回顾:AI爬虫激增,后量子加密达到50%,Go请求量翻倍

Cloudflare发布的《2025年网络回顾》显示全球互联网流量增长19%,Googlebot主导网络爬虫。自动API请求中20%来自Go客户端,后量子加密得到广泛应用。报告分析了流量、AI和安全等多个方面,指出AI平台爬虫增加但未带来相应流量。

Cloudflare年度回顾:AI爬虫激增,后量子加密达到50%,Go请求量翻倍

InfoQ
InfoQ · 2025-12-31T07:38:00Z

谷歌今日对爬虫公司SerpApi提起诉讼,指控其非法抓取受版权保护的内容并绕过安全措施,旨在保护网站和版权方的权益。谷歌遵循行业标准的爬虫协议,而SerpApi则通过隐蔽手段侵犯这些协议,影响内容提供者的选择权。

我们为何对SerpApi的非法抓取采取法律行动

The Keyword
The Keyword · 2025-12-19T17:51:00Z

谷歌今天起诉爬虫公司SerpApi,指控其非法抓取版权内容并绕过安全措施,旨在保护网站和版权持有者的权益。谷歌遵循行业标准的爬虫协议,而SerpApi则通过不当手段获取内容。

我们为何对SerpApi的非法抓取采取法律行动

The Keyword
The Keyword · 2025-12-19T17:51:00Z
Katana - ProjectDiscovery开发的开源网站爬虫和蜘蛛框架,专注于高效的资产发现和数据收集

Katana是一个开源的下一代爬虫框架,旨在高效、可扩展地进行网站爬取和资产发现,支持动态渲染和插件化爬取规则,并与ProjectDiscovery生态系统集成,适用于网络安全扫描和数据收集。

Katana - ProjectDiscovery开发的开源网站爬虫和蜘蛛框架,专注于高效的资产发现和数据收集

云原生
云原生 · 2025-11-17T11:30:00Z

文章讨论了社交媒体监测服务对论坛的影响,作者分享了应对爬虫的技术经验,包括封禁IP、使用过滤器和分析HTTP头信息等策略。强调识别对手的重要性,并提出在应对恶意爬虫时应保持灵活和隐蔽,以保护网站资源和数据。

反击网络爬虫

程序师
程序师 · 2025-11-17T01:52:37Z

在FreeBSD上配置Anubis反AI爬虫工具,有效解决了因AI爬虫导致的服务器负载问题。通过安装Anubis并配置HAProxy,成功减轻了服务器压力,提升了响应速度。Anubis利用工作量证明挑战有效阻止了恶意爬虫请求。

在 FreeBSD 上配置 Anubis 反 AI 爬虫工具

程序师
程序师 · 2025-10-15T04:00:10Z
在人工智能时代构建针对高级爬虫威胁的独特个性化防御

Cloudflare推出了一种新方法,通过个性化的行为异常检测来应对AI驱动的爬虫攻击。该平台实时分析流量,识别异常行为,增强网站安全性,保护用户免受恶意爬虫的侵害。

在人工智能时代构建针对高级爬虫威胁的独特个性化防御

The Cloudflare Blog
The Cloudflare Blog · 2025-09-23T14:00:00Z
通过伽利略项目帮助保护记者和地方新闻免受AI爬虫的侵扰

Cloudflare的伽利略项目现提供免费的AI爬虫管理服务,旨在帮助750名记者和非营利组织保护网站内容,以应对AI导致的新闻行业流量下降,支持独立媒体适应数字环境,维护新闻自由与民主。

通过伽利略项目帮助保护记者和地方新闻免受AI爬虫的侵扰

The Cloudflare Blog
The Cloudflare Blog · 2025-09-23T13:00:00Z

本文探讨了基于Nginx的限流与防爬虫配置,分析了流量突增和恶意爬虫问题,介绍了令牌桶和漏桶算法。通过IP、URI和地理位置等方式进行限流,并结合User-Agent检测和JavaScript挑战验证,以提升网站安全性。最后强调了监控与黑名单管理的重要性。

Nginx限流与防爬虫配置方案 - 运维工程师实战指南

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-09-19T00:00:00Z
七种最佳AI网络爬虫工具

本文介绍了七种最佳的AI网络爬虫工具,帮助用户轻松提取数据。这些工具支持无代码操作,适合初学者,能够处理复杂网站。

七种最佳AI网络爬虫工具

KDnuggets
KDnuggets · 2025-09-08T12:00:22Z

随着人工智能爬虫的增加,小型网站面临流量问题,真实用户流量仅占5%。网站管理员开始过滤爬虫流量并考虑建立IP情报系统,但仍难以阻止爬虫攻击。解决方案包括优化网站架构和使用API端点,以减轻数据库压力。网站运营者需不断调整策略以应对复杂的网络环境。

人工智能网络爬虫对所有内容的无休止渴求正在摧毁网站

程序师
程序师 · 2025-09-04T12:10:55Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码