{% extends "base.html" %} {% block content %}
爬虫训练场项目 正在建设中~

普通爬虫


单页爬虫

目标数据呈现在单一页面中,使用最简单的爬虫库可以直接采集,一般用正则表达式即可完成数据提取。

难度:⭐

案例: 新闻页 图片清单 表格

分页爬虫

本案例是由 2760 条数据组成的分页爬虫,数据为国内学校清单,主要用于练习分页数据采集。

难度:⭐

案例: 学校分页数据

二进制文件采集

最新更新

本案例用于大家学习文件和视频文件内容采集,重点掌握 M3U8 格式视频下载,掌握二进制内容保存。

难度:⭐

案例: 普通 MP4文件 M3U8文件

单页爬虫

目标数据呈现在单一页面中,使用最简单的爬虫库可以直接采集,一般用正则表达式即可完成数据提取。

难度:⭐

案例: 新闻页 图片清单 表格

PC端反爬


UA 参数反爬

最新更新

该案例要求爬虫程序构造请求头的时候,必须携带 User-Agent 参数,否则会返回403错误。

难度:⭐

案例: 预言故事

定值 Cookie 反爬

最新更新

该案例要求爬虫程序的请求头携带固定Cookie值,如果缺少无法访问。

难度:⭐

案例: 边界故事

{% endblock %}