This website requires JavaScript.
Explore
Help
Sign In
scalett
/
crawl4zeroerr
Watch
2
Star
1
Fork
0
You've already forked crawl4zeroerr
Code
Issues
Pull Requests
Actions
Packages
Projects
Releases
Wiki
Activity
7
Commits
1
Branch
0
Tags
main
Go to file
Add File
New File
Upload File
Apply Patch
Code
Clone
HTTPS
Tea CLI
Open with VS Code
Open with VSCodium
Open with Intellij IDEA
Download ZIP
Download TAR.GZ
Download BUNDLE
Oo
9e14b56275
优化文档导出层级与链接保真,统一正文标题映射并增强 Word 段落超链接处理。
...
同时移除不再使用的文档后处理依赖,减少汇总导出流程中的冗余步骤。 Made-with: Cursor
2026-03-30 10:32:34 +08:00
zeroerr_crawler
优化文档导出层级与链接保真,统一正文标题映射并增强 Word 段落超链接处理。
2026-03-30 10:32:34 +08:00
.gitignore
优化摘要配置加载与文档输出兼容性,并补充本地配置忽略规则。
2026-03-26 09:39:07 +08:00
1_零差云控官网爬虫方案.md
新增标题层级处理规则:1. 新增主页链接;2.新增docx后处理,合并同一层级的标题;3. 优化层级,h1不重复
2026-02-09 18:53:32 +08:00
config.yaml.example
优化摘要配置加载与文档输出兼容性,并补充本地配置忽略规则。
2026-03-26 09:39:07 +08:00
main.py
初始提交:零差云控官网爬虫项目
2026-01-29 17:29:14 +08:00
requirements.txt
优化文档导出层级与链接保真,统一正文标题映射并增强 Word 段落超链接处理。
2026-03-30 10:32:34 +08:00
Description
No description provided
118
MiB
Languages
Python
100%