8000 GitHub - 2207397265/paper-burner: Paper Burner - PDF文档OCR与翻译工具
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

2207397265/paper-burner

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

26 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Paper Burner - PDF文档OCR与翻译工具

版本 许可证 JavaScript

📝 项目介绍

Paper Burner是为广大研究生和研究人员设计的PDF文档处理工具。考虑到对于非母语者,直接阅读英文PDF文献不方便、效率低,而目前的全文翻译工具无法很好地处理PDF中的公式和图表,且存在段落之间断开、语意不连贯的问题,Paper Burner能够从PDF文档中提取文本(OCR),将其转换为Markdown格式,并支持使用多种AI模型进行高质量翻译,完美保留公式、图表、格式,最大限度地保持语意连贯通顺。

本工具完全在浏览器中运行。

✨ 核心特性

  • PDF文本提取:使用Mistral AI的OCR技术从PDF文档中精确提取文本内容
  • Markdown转换:自动将提取的内容转换为规范的Markdown格式
  • 图像处理:自动提取并保存PDF中的图片
  • 多模型翻译:支持多种顶级AI大模型进行翻译
  • 长文档翻译:自动按照文章小节分段处理长文档,避免段落中出现断点,确保翻译质量和内容一致性
  • 保留格式:翻译过程中完美保留原文档的格式、公式和结构

📚 支持的翻译大模型

  • DeepSeek v3
  • Gemini 2.0 Flash
  • Claude 3.5 Sonnet
  • 阿里云百炼Deepseek-v3
  • 火山引擎Deepseek-v3
  • Mistral Large
  • 与OpenAI、Anthropic、Gemini请求格式兼容的自定义模型

🚀 快速开始

在线使用

本工具可以直接通过浏览器使用,无需安装:

  1. 访问在线版Paper Burner
  2. 输入必要的API密钥
  3. 上传PDF文档
  4. 选择所需的翻译模型和目标语言
  5. 点击处理按钮
  6. 等待处理完成,下载压缩包并解压
  7. 使用你喜欢的Markdown阅读器打开Markdown文件

🔑 API密钥配置

本工具需要以下API密钥才能正常工作:

  1. Mistral API Key(必需):用于PDF文档的OCR处理

  2. 翻译API Key(可选):根据选择的翻译模型而定

所有API密钥均在本地浏览器中处理,不会上传到任何服务器,确保安全性。您可以选择通过浏览器本地存储功能保存密钥,方便下次使用。

⚠️ 注意事项

  • AI模型翻译结果仅供参考,重要内容请以原文为准,本工具不对翻译内容的准确性、完整性和合法性负责
  • 大型文档的处理可能需要较长时间,请耐心等待
  • 对于包含特殊格式的PDF,OCR结果可能需要人工校对
  • 使用API时请遵守相应服务提供商的使用条款

🤝 贡献指南

欢迎为Paper Burner做出贡献!您可以通过以下方式参与:

  1. 提交Issue:报告Bug或提出新功能建议
  2. 提交Pull Request:改进代码或添加新功能
  3. 改进文档:完善使用说明或提供使用示例
  4. 为项目点一个Star⭐:

📄 许可证

本项目采用GPL-v2许可证 - 详见 LICENSE 文件

如果这个工具对您有帮助,请考虑给项目一个⭐

Contributors

About

Paper Burner - PDF文档OCR与翻译工具

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • JavaScript 74.9%
  • HTML 25.1%
0