MarkPDFdown是基于大型语言模型视觉识别的PDF转Markdown工具,用于将PDF文件转换为高质量的Markdown格式。MarkPDFdown利用多模态AI模型,能够准确提取文本、保留格式,处理复杂的文档结构,如表格、公式和图表。
MarkPDFdown的目标是简化将PDF文档转换为可编辑的Markdown文本的过程,通过使用先进的多模态AI模型,可以准确地提取文本并保留格式,处理复杂的文档结构。
PDF转Markdown:可以将任何PDF文档转换为格式良好的Markdown文本。
图片转Markdown:可以将图片转换为格式良好的Markdown文本。
多模态理解:利用AI来理解文档结构和内容。
格式保留:保持标题、列表、表格和其他格式元素。
可定制模型:可以根据需要配置模型。
1、创建一个名为markpdfdown
的conda环境:
conda create -n markpdfdown python=3.9
2、激活环境:
conda activate markpdfdown
3、克隆仓库:
git clone https://github.com/MarkPDFdown/markpdfdown.git
4、进入目录并安装依赖项:
cd markpdfdown
pip install -r requirements.txt
设置OpenAI API密钥(可选):
export OPENAI_API_KEY=<your-api-key>
将PDF文件转换为Markdown:
python main.py <tests/input.pdf> output.md
将图片转换为Markdown:
python main.py <input_image.png> output.md
指定页面范围:
python main.py page_start page_end <tests/input.pdf> output.md
docker run -i -e OPENAI_API_KEY=<your-api-key> -e OPENAI_API_BASE=<your-api-base> -e OPENAI_DEFAULT_MODEL=<your-model> jorbenzhu/markpdfdown <input.pdf> output.md
• Python 3.9+
• 依赖项在requirements.txt
中列出
• 访问指定的多模态AI模型