跳转到内容

标签：爬虫

返回标签墙

Tag

#爬虫

这个标签下收录了 4 篇内容，包含博客记录与知识库条目。

4 全部

3 博客

1 知识库

1.7w 字数

Blog

博客

3 篇

关于逆向项目的一些想法 2026/6/12 · 约 6 分钟阅读

继上一次爬虫架构设计的博客记录，回顾写一写当时做逆向项目的一些经历和感受。肯定没有当时那样的心情了，但还是想把一些想法记录下来，算是对这个项目的一个总结和反思。为什么想写这篇最近看到不少分享逆向的文章，感觉挺有意思，也想记录一下自己在...
大规模无状态爬虫系统设计 2026/5/22 · 约 9 分钟阅读

这篇文章记录的是一套大规模无状态爬虫系统的设计。先说明一下参与边界：这套系统不是我一个人独立设计完成的。我主要负责爬虫端的核心设计和实现，另一位同事是项目主要负责人，他有十余年的架构设计经验，整体系统设计、调度中心以及很多关键取舍都由他主...
爬虫与 JS 逆向面试题复盘 2025/9/16 · 约 16 分钟阅读

这是一组爬虫和 JS 逆向相关的面试题。这类面试不会只问“会不会用 requests”，更常见的是从一个具体业务场景开始追问：怎么登录、怎么抓动态接口、怎么处理反爬、百万级数据怎么调度、数据怎么进入后续处理链路。这篇文章按面试题复盘的方...

Knowledge

知识库

1 篇

Scrapy 框架基础知识建议学习 45 分钟

通过一个公开练习站点示例，学习 Scrapy 项目创建、数据解析、分页抓取、Item 与 Pipeline 的基础用法。