更新爬虫方案文档,增加服务与支持-详细页面的输出信息;优化基础爬虫类,增强标题提取和内容去重逻辑;根据doc2md.py调整图片处理逻辑以改善Word文档生成效果。
This commit is contained in:
@@ -27,14 +27,17 @@ crawl/
|
||||
| 常见问题 | `python main.py issue` | 32篇 | ✅ 完成 |
|
||||
| 企业新闻 | `python main.py news` | 11篇 | ✅ 完成 |
|
||||
| 认证与资质 | `python main.py certification` | 10篇 | ✅ 完成 |
|
||||
| 机器人关节 | `python main.py erob` | 11篇 | ✅ 完成 |
|
||||
| 机器人关节 | `python main.py erob` | 12篇 | ✅ 完成 |
|
||||
| 编码器 | `python main.py ecoder` | 7篇 | ✅ 完成 |
|
||||
| 配件 | `python main.py tools` | 13篇 | ✅ 完成 |
|
||||
| 关于我们 | `python main.py about` | 2篇 | ✅ 完成 |
|
||||
| 服务与支持 | `python main.py support` | 1篇 | ✅ 完成 |
|
||||
| 服务与支持-详细页面 | `python main.py service_detail` | 7篇 | ✅ 完成 |
|
||||
| 资料下载 | `python main.py download` | 1篇 | ✅ 完成 |
|
||||
|
||||
**总计: 102 篇文章**
|
||||
**总计: 110 篇文章**
|
||||
|
||||
> 注:服务与支持和服务与支持-详细页面合并输出到同一个目录 `output/服务与支持/`
|
||||
|
||||
## 使用方法
|
||||
|
||||
|
||||
Reference in New Issue
Block a user