Commit Graph

3 Commits

Author SHA1 Message Date
Oo
d257cbaed3 优化摘要配置加载与文档输出兼容性,并补充本地配置忽略规则。
通过引入 config.yaml.example 和环境变量覆盖提升可配置性,同时统一 Word 默认中文字体并忽略本地 config.yaml,避免敏感信息误提交。

Made-with: Cursor
2026-03-26 09:39:07 +08:00
oy2020
dbe9ba3629 新增标题层级处理规则:1. 新增主页链接;2.新增docx后处理,合并同一层级的标题;3. 优化层级,h1不重复 2026-02-09 18:53:32 +08:00
oy2020
c707704d80 更新爬虫方案文档,增加摘要提取模块以生成文档摘要;优化基础爬虫类的标题提取逻辑,支持多个选择器,调整内容处理逻辑以去除重复标题。 2026-01-31 16:34:13 +08:00