This website requires JavaScript.
Explore
Help
Sign In
scalett
/
crawl4zeroerr
Watch
2
Star
1
Fork
0
You've already forked crawl4zeroerr
Code
Issues
Pull Requests
Actions
Packages
Projects
Releases
Wiki
Activity
7
Commits
1
Branch
0
Tags
9e14b5627527aef744667890c6d34d3cb0e79dc8
Commit Graph
3 Commits
Author
SHA1
Message
Date
Oo
9e14b56275
优化文档导出层级与链接保真,统一正文标题映射并增强 Word 段落超链接处理。
...
同时移除不再使用的文档后处理依赖,减少汇总导出流程中的冗余步骤。 Made-with: Cursor
2026-03-30 10:32:34 +08:00
oy2020
3c625d1c3a
更新爬虫方案文档,增加服务与支持-详细页面的输出信息;优化基础爬虫类,增强标题提取和内容去重逻辑;根据doc2md.py调整图片处理逻辑以改善Word文档生成效果。
2026-01-31 09:30:33 +08:00
oy2020
51b67b9e68
初始提交:零差云控官网爬虫项目
2026-01-29 17:29:14 +08:00