Logo
Explore Help
Sign In
scalett/crawl4zeroerr
2
1
Fork 0
You've already forked crawl4zeroerr
Code Issues Pull Requests Actions Packages Projects Releases Wiki Activity
4 Commits 1 Branch 0 Tags
c707704d80c96576a72455aecbe80a4a6d08cf62
Commit Graph

4 Commits

This Branch
This Branch
All Branches
Author SHA1 Message Date
oy2020
c707704d80 更新爬虫方案文档,增加摘要提取模块以生成文档摘要;优化基础爬虫类的标题提取逻辑,支持多个选择器,调整内容处理逻辑以去除重复标题。 2026-01-31 16:34:13 +08:00
oy2020
3c625d1c3a 更新爬虫方案文档,增加服务与支持-详细页面的输出信息;优化基础爬虫类,增强标题提取和内容去重逻辑;根据doc2md.py调整图片处理逻辑以改善Word文档生成效果。 2026-01-31 09:30:33 +08:00
oy2020
3670129972 忽略 output 文件夹,移除已跟踪的 output 文件 2026-01-29 17:45:17 +08:00
oy2020
51b67b9e68 初始提交:零差云控官网爬虫项目 2026-01-29 17:29:14 +08:00
Powered by Gitea Version: 1.25.2 Page: 14ms Template: 2ms
English
Bahasa Indonesia Deutsch English Español Français Gaeilge Italiano Latviešu Magyar nyelv Nederlands Polski Português de Portugal Português do Brasil Suomi Svenska Türkçe Čeština Ελληνικά Български Русский Українська فارسی മലയാളം 日本語 简体中文 繁體中文(台灣) 繁體中文(香港) 한국어
Licenses API