Search Results

Found 72,910 repositories(showing 30)

EasySpider

NaiboWang

💚100

A visual no-code/code-free web crawler/spider易采集：一个可视化浏览器自动化测试/数据采集/爬虫软件，可以无代码图形化的设计和执行爬虫任务。别名：ServiceWrapper面向Web应用的智能化服务封装系统。

44.1k

5.4k

AGPL-3.0

JavaScript

Updated 2 hours ago

batch-processingbatch-scriptcode-free+17

colly

gocolly

💚100

Elegant Scraper and Crawler Framework for Golang

25.2k

1.8k

Apache-2.0

Updated 1 day ago

crawlercrawlingframework+5

proxy_pool

jhao104

💚100

Python ProxyPool for web spider

23.3k

5.4k

MIT

Python

Updated 10 hours ago

crawlerhttpproxy+2

python爬虫教程系列、从0到1学习python爬虫，包括浏览器抓包，手机APP抓包，如 fiddler、mitmproxy，各种爬虫涉及的模块的使用，如：requests、beautifulSoup、selenium、appium、scrapy等，以及IP代理，验证码识别，Mysql，MongoDB数据库的python使用，多线程多进程爬虫的使用，css 爬虫加密逆向破解，JS爬虫逆向，分布式爬虫，爬虫项目实战实例等

21.5k

3.9k

MIT

Python

Updated 9 hours ago

python-scriptpython-spiderpython3

python-spider

Jack-Cherish

💚90

:rainbow:Python3网络爬虫实战：淘宝、京东、网易云、B站、12306、抖音、笔趣阁、漫画小说下载、音乐电影下载等

19.6k

6.0k

Python

Updated 9 hours ago

pythonpython-spiderpython3+1

spiderfoot

smicallef

💚95

SpiderFoot automates OSINT for threat intelligence and mapping your attack surface.

17.3k

2.9k

MIT

Python

Updated 1 hour ago

attacksurfacecticybersecurity+16

pyspider

binux

💚95

A Powerful Spider(Web Crawler) System in Python.

17.0k

3.7k

Apache-2.0

Python

Updated 6 hours ago

crawlerpython

Douyin_TikTok_Download_API

Evil0ctal

💚100

🚀「Douyin_TikTok_Download_API」是一个开箱即用的高性能异步抖音、快手、TikTok、Bilibili数据爬取工具，支持API调用，在线批量解析及下载。

17.0k

2.5k

Apache-2.0

Python

Updated 41 minutes ago

apiasynccrawler+17

katana

projectdiscovery

💚96

A next-generation crawling and spidering framework.

16.4k

1.1k

MIT

Updated 7 minutes ago

clicrawlergocrawler+4

examples-of-web-crawlers

shengqiangzhang

💚100

一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、微信读书、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )

14.6k

3.8k

MIT

HTML

Updated 9 hours ago

agent-poolcrawlerexample+12

Photon

s0md3v

💚98

Incredibly fast crawler designed for OSINT.

12.8k

1.7k

GPL-3.0

Python

Updated 3 hours ago

crawlerinformation-gatheringosint+2

crawlab

crawlab-team

💚97

Distributed web crawler admin platform for spiders management regardless of languages and frameworks. 分布式爬虫管理平台，支持任何语言和框架

12.2k

1.9k

BSD-3-Clause

Updated 10 hours ago

crawlabcrawlercrawling-tasks+10

spider-flow

ssssssss-team

💚96

新一代爬虫平台，以图形化方式定义爬虫流程，不写代码即可完成爬虫。

11.3k

2.2k

MIT

Java

Updated 6 hours ago

crawlerjsoupspider+6

avbook

guyueyingmu

💚90

AV 电影管理系统， avmoo , javbus , javlibrary 爬虫，线上 AV 影片图书馆，AV 磁力链接数据库，Japanese Adult Video Library,Adult Video Magnet Links - Japanese Adult Video Database

9.9k

2.0k

PHP

Updated 12 hours ago

adultadult-videoavmoo+10

DouyinLiveRecorder

ihmily

💛87

可循环值守和多人录制的直播录制软件，支持抖音、TikTok、Youtube、快手、虎牙、斗鱼、B站、小红书、pandatv、sooplive、flextv、popkontv、twitcasting、winktv、百度、微博、酷狗、17Live、Twitch、Acfun、CHZZK、shopee等40+平台直播录制

9.7k

1.3k

MIT

Python

Updated 8 hours ago

acfun-livedouyindouyin-api+16

weiboSpider

dataabc

💚90

新浪微博爬虫，用python爬取新浪微博数据

9.5k

2.1k

Python

Updated 9 hours ago

help-wantedpythonpython3+2

InfoSpider

kangvcar

💚93

INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰，旨在安全快捷的帮助用户拿回自己的数据，工具代码开源，流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书。

8.2k

1.5k

GPL-3.0

Python

Updated 9 hours ago

automationchromecrawl+8

awesome-web-scraping

lorien

💛82

List of libraries, tools and APIs for web scraping and data processing.

7.8k

884

NOASSERTION

Makefile

Updated 11 hours ago

captcha-bypasscaptcha-recaptchacrawler+11

pholcus

andeya

💛88

Pholcus is a distributed high-concurrency crawler software written in pure golang

7.6k

1.7k

Apache-2.0

Updated 18 hours ago

crowlerspider

PythonSpiderNotes

lining0806

💛87

Python入门网络爬虫之精华版

7.4k

2.2k

Python

Updated 16 hours ago

captchacookiepython+4

Anti-Anti-Spider

luyishisi

💛87

越来越多的网站具有反爬虫特性，有的用图片隐藏关键数据，有的使用反人类的验证码，建立反反爬虫的代码仓库，通过与不同特性的网站做斗争（无恶意）提高技术。（欢迎提交难以采集的网站）（因工作原因，项目暂停）

7.3k

2.1k

Python

Updated 3 days ago

geekpythonspider

awesome-crawler

BruceDone

💛85

A collection of awesome web crawler,spider in different languages

7.2k

746

MIT

Updated 15 hours ago

awesomecrawlernode-crawler+4

node-crawler

bda-research

💛86

Web Crawler/Spider for NodeJS + server-side jQuery ;-)

6.8k

873

MIT

TypeScript

Updated 10 hours ago

cheeriocrawlerextract-data+4

AreaCity-JsSpider-StatsGov

xiangyuecn

💛86

省市区县乡镇三级或四级城市数据，带拼音标注、坐标、行政区域边界范围；2026年04月03日最新采集，提供csv格式文件，支持在线转成多级联动js代码、通用json格式，提供软件转成shp、geojson、sql、导入数据库；带浏览器里面运行的js采集源码，综合了中华人民共和国民政部、中国•国家地名信息库、统计局、高德地图、腾讯地图行政区划数据

6.5k

990

MIT

JavaScript

Updated 14 minutes ago

haipproxy

SpiderClub

💛85

:sparkling_heart: High available distributed ip proxy pool, powerd by Scrapy and Redis

5.6k

901

MIT

Python

Updated 2 days ago

crawlerdistributedhigh-availability+5

Wechatsync

wechatsync

💛84

一键同步文章到多个内容平台，支持今日头条、WordPress、知乎、简书、掘金、CSDN、typecho各大平台，一次发布，多平台同步发布。解放个人生产力

5.2k

837

GPL-3.0

TypeScript

Updated 29 minutes ago

blogchromechrome-extension+6

font-spider

aui

💛79

Smart webfont compression and format conversion tool

5.1k

398

MIT

JavaScript

Updated 9 hours ago

eotfont-faceopentype+6

Spider_XHS

cv-cat

💛79

小红书爬虫数据采集，小红书全域运营解决方案

4.9k

861

JavaScript

Updated 4 hours ago

TopList

tophubs

💛84

今日热榜，一个获取各大热门网站热门头条的聚合网站，使用Go语言编写，多协程异步快速抓取信息，预览:https://mo.fish

4.7k

945

Apache-2.0

Updated 1 day ago

golanghothotlist+2

novel-plus

201206030

💛89

novel-plus 是一个多端（PC、WAP）阅读、功能完善的小说 CMS 系统。包括小说推荐、小说检索、小说排行、小说阅读、小说书架、小说评论、小说爬虫、会员中心、作家专区、充值订阅、新闻发布等功能。

4.5k

1.5k

Apache-2.0

Java

Updated 14 hours ago

bookcrawlnovel+2

GitHub Explorer

Search Results

EasySpider

colly

proxy_pool

learn_python3_spider

python-spider

spiderfoot

pyspider

Douyin_TikTok_Download_API

katana

examples-of-web-crawlers

Photon

crawlab

spider-flow

avbook

DouyinLiveRecorder

weiboSpider

InfoSpider

awesome-web-scraping

pholcus

PythonSpiderNotes

Anti-Anti-Spider

awesome-crawler

node-crawler

AreaCity-JsSpider-StatsGov

haipproxy

Wechatsync

font-spider

Spider_XHS

TopList

novel-plus

EasySpider

colly

proxy_pool

learn_python3_spider

python-spider

spiderfoot

pyspider

Douyin_TikTok_Download_API

katana

examples-of-web-crawlers

Photon

crawlab

spider-flow

avbook

DouyinLiveRecorder

weiboSpider

InfoSpider

awesome-web-scraping

pholcus

PythonSpiderNotes

Anti-Anti-Spider

awesome-crawler

node-crawler

AreaCity-JsSpider-StatsGov

haipproxy

Wechatsync

font-spider

Spider_XHS

TopList

novel-plus