This website requires JavaScript.
Explore
Help
Sign In
scalett
/
crawl4zeroerr
Watch
2
Star
1
Fork
0
You've already forked crawl4zeroerr
Code
Issues
Pull Requests
Actions
Packages
Projects
Releases
Wiki
Activity
4
Commits
1
Branch
0
Tags
c707704d80c96576a72455aecbe80a4a6d08cf62
Go to file
Code
Clone
HTTPS
Tea CLI
Open with VS Code
Open with VSCodium
Open with Intellij IDEA
Download ZIP
Download TAR.GZ
Download BUNDLE
oy2020
c707704d80
更新爬虫方案文档,增加摘要提取模块以生成文档摘要;优化基础爬虫类的标题提取逻辑,支持多个选择器,调整内容处理逻辑以去除重复标题。
2026-01-31 16:34:13 +08:00
zeroerr_crawler
更新爬虫方案文档,增加摘要提取模块以生成文档摘要;优化基础爬虫类的标题提取逻辑,支持多个选择器,调整内容处理逻辑以去除重复标题。
2026-01-31 16:34:13 +08:00
.gitignore
更新爬虫方案文档,增加摘要提取模块以生成文档摘要;优化基础爬虫类的标题提取逻辑,支持多个选择器,调整内容处理逻辑以去除重复标题。
2026-01-31 16:34:13 +08:00
1_零差云控官网爬虫方案.md
更新爬虫方案文档,增加摘要提取模块以生成文档摘要;优化基础爬虫类的标题提取逻辑,支持多个选择器,调整内容处理逻辑以去除重复标题。
2026-01-31 16:34:13 +08:00
main.py
初始提交:零差云控官网爬虫项目
2026-01-29 17:29:14 +08:00
requirements.txt
更新爬虫方案文档,增加服务与支持-详细页面的输出信息;优化基础爬虫类,增强标题提取和内容去重逻辑;根据doc2md.py调整图片处理逻辑以改善Word文档生成效果。
2026-01-31 09:30:33 +08:00
Description
No description provided
118
MiB
Languages
Python
100%