[PYTHON/LANGCHAIN] PyPDFLoader 클래스 : 생성자에서 extract_images 인자를 사용해 PDF 파일 문서 로드시 이미지 텍스트 추출하기

■ PyPDFLoader 클래스의 생성자에서 extract_images 인자를 사용해 PDF 파일 문서 로드시 이미지 텍스트를 추출하는 방법을 보여준다.

main.py

requirements.txt

※ pip install langchain-community pypdf rapidocr-onnxruntime 명령을 실행했다.

nke-10k-2023.pdf

Advertisements