pdfGPT 介绍
了解项目的详细信息和使用方法
pdfGPT
pdfGPT 是一个基于 GPT 模型的应用,可以与上传的 PDF 文件进行交互。它具有以下特性:
- 将 PDF 文件智能地分成较小的段落,并使用强大的深度平均网络编码器生成嵌入向量。
- 在 PDF 内容上进行语义搜索,并传递最相关的嵌入向量给 OpenAI。
- 通过自定义的逻辑生成精确的回答。返回的回答甚至可以引用页面编号,提高回答的可信度,并帮助快速定位相关信息。相比于 OpenAI 的简单回答,pdfGPT 的回答更好。
- pdfGPT 使用 KNN 算法来解决类似的问题。
- 支持将 pdfGPT 部署到生产环境,使用 langchain-serve。
pdfGPT 可以通过以下方式使用:
- 在本地使用 Docker 运行 pdfGPT。
- 在本地使用 Gradio playground 与 pdfGPT 进行交互。
- 在云端使用 Jina Cloud 部署 pdfGPT。
pdfGPT 也可以通过 cURL 命令与 pdfGPT 进行交互,可以传递 PDF 的 URL 或者上传 PDF 文件。
pdfGPT 还可以在本地运行,可以通过 Docker 镜像来运行 pdfGPT。
pdfGPT 是一个开源项目,使用 MIT 许可证。如果您在研究中使用了 pdfGPT,或者引用了该项目,请引用上述的 GitHub 仓库链接。
pdfGPT 的未来版本计划包括支持更多的 PDF 文件、OCR 功能以及基于 Node.js 的 Web 应用程序。