■ MarkdownHeaderTextSplitter 클래스의 생성자에서 headers_to_split_on 인자를 사용해 MarkdownHeaderTextSplitter 객체를 만드는 방법을 보여준다.
▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 |
from langchain_text_splitters import MarkdownHeaderTextSplitter codeString = "# Foo\n\n ## Bar\n\nHi this is Jim\n\nHi this is Joe\n\n ### Boo \n\n Hi this is Lance \n\n ## Baz\n\n Hi this is Molly" headerTupleListToSplitOn = [ ("#" , "Header 1"), ("##" , "Header 2"), ("###", "Header 3") ] markdownHeaderTextSplitter = MarkdownHeaderTextSplitter(headers_to_split_on = headerTupleListToSplitOn) |
※ pip install langchain-text-splitters 명령을 실행했다.