科学工具
科学工具让世界更美好
让世界更美好

MarkPDFdown:PDF转Markdown工具MarkPDFdown:PDF转Markdown工具

MarkPDFdown是基于大型语言模型视觉识别的PDF转Markdown工具,用于将PDF文件转换为高质量的Markdown格式。MarkPDFdown利用多模态AI模型,能够准确提取文本、保留格式,处理复杂的文档结构,如表格、公式和图表。

MarkPDFdown的目标是简化将PDF文档转换为可编辑的Markdown文本的过程,通过使用先进的多模态AI模型,可以准确地提取文本并保留格式,处理复杂的文档结构。

主要功能

PDF转Markdown:可以将任何PDF文档转换为格式良好的Markdown文本。

图片转Markdown:可以将图片转换为格式良好的Markdown文本。

多模态理解:利用AI来理解文档结构和内容。

格式保留:保持标题、列表、表格和其他格式元素。

可定制模型:可以根据需要配置模型。

安装和使用

安装

1、创建一个名为markpdfdown的conda环境:

conda create -n markpdfdown python=3.9

2、激活环境:

conda activate markpdfdown

3、克隆仓库:

git clone https://github.com/MarkPDFdown/markpdfdown.git

4、进入目录并安装依赖项:

cd markpdfdown
pip install -r requirements.txt

使用

基本用法

设置OpenAI API密钥(可选):

export OPENAI_API_KEY=<your-api-key>

将PDF文件转换为Markdown:

python main.py <tests/input.pdf> output.md

将图片转换为Markdown:

python main.py <input_image.png> output.md

高级用法

指定页面范围:

python main.py page_start page_end <tests/input.pdf> output.md

Docker使用

docker run -i -e OPENAI_API_KEY=<your-api-key> -e OPENAI_API_BASE=<your-api-base> -e OPENAI_DEFAULT_MODEL=<your-model> jorbenzhu/markpdfdown <input.pdf> output.md

要求

• Python 3.9+ • 依赖项在requirements.txt中列出 • 访问指定的多模态AI模型