[PYTHON/LANGCHAIN] RecursiveCharacterTextSplitter 클래스 : 생성자에서 separators 인자 사용하기

■ RecursiveCharacterTextSplitter 클래스의 생성자에서 separators 인자를 사용하는 방법을 보여준다.

※ 일부 쓰기 시스템에는 단어 경계가 없다(예 : 중국어, 일본어, 태국어).
※ ["\n\n", "\n", " ", ""]의 기본 구분 기호 목록을 사용하여 텍스트를 분할하면 단어가 덩어리 간에 분할될 수 있다.
※ 단어를 함께 유지하려면 추가 구두점을 포함하도록 구분 기호 목록을 재정의할 수 있다.

main.py

requirements.txt

※ pip install langchain-text-splitters 명령을 실행했다.

state_of_the_union.zip

Advertisements