doc-cleaner

分类: 文档与知识管理 | 上传者: notoriouslabnotoriouslab | 下载: 0 | 版本: v1.0(最新)

将 PDF、DOCX、XLSX 和文本文件转换为干净、结构化的 Markdown。 CJK 友好、餐桌友好、隐私第一。

更新日志: Source: GitHub https://github.com/notoriouslab/doc-cleaner

目录结构

当前层级: tree/main/

  • 📁 .claude/
    • 📁 commands/
      • 📁 spectra/
        • 📄 apply.md 9.6 KB
        • 📄 archive.md 5.3 KB
        • 📄 ask.md 7.2 KB
        • 📄 audit.md 9.5 KB
        • 📄 debug.md 4.4 KB
        • 📄 discuss.md 5.2 KB
        • 📄 ingest.md 9.9 KB
        • 📄 propose.md 10.5 KB
  • 📁 ai/
    • 📄 __init__.py 0 B
    • 📄 base.py 3.3 KB
    • 📄 gemini.py 1.9 KB
    • 📄 groq.py 3.9 KB
    • 📄 mlx.py 3.2 KB
    • 📄 nvidia.py 4.0 KB
    • 📄 ollama.py 3.9 KB
  • 📁 classifiers/
    • 📄 __init__.py 0 B
    • 📄 noise.py 3.5 KB
    • 📄 pdf_classifier.py 4.7 KB
    • 📄 pii.py 3.8 KB
  • 📁 output/
    • 📄 __init__.py 0 B
    • 📄 markdown.py 2.7 KB
  • 📁 parsers/
    • 📄 __init__.py 0 B
    • 📄 docx.py 3.6 KB
    • 📄 pdf.py 6.4 KB
    • 📄 text.py 1.2 KB
    • 📄 xlsx.py 3.1 KB
  • 📁 prompts/
    • 📄 __init__.py 0 B
    • 📄 default.txt 835 B
    • 📄 finance.txt 1.2 KB
  • 📄 .env.example 275 B
  • 📄 .gitignore 462 B
  • 📄 CLAUDE.md 1.1 KB
  • 📄 cleaner.py 22.0 KB
  • 📄 config.example.json 928 B
  • 📄 CONTRIBUTING.md 2.5 KB
  • 📄 LICENSE 1.0 KB
  • 📄 README.en.md 13.3 KB
  • 📄 README.md 14.0 KB
  • 📄 requirements.txt 761 B
  • 📄 SECURITY.md 3.7 KB
  • 📄 SKILL.md 2.8 KB

SKILL.md

登录后下载/点赞/收藏 ❤ 159 | ★ 0
评论 0

请先登录后评论。

评论加载中...