[PYTHON/LANGCHAIN] RunnableWithMessageHistory 클래스 : stream 메소드를 사용해 응답 스트리밍 처리하기

■ RunnableWithMessageHistory 클래스의 stream 메소드를 사용해 응답 스트리밍을 처리하는 방법을 보여준다.

• LLM이 응답하는 데 시간이 걸릴 수 있으므로 사용자 경험을 개선하기 위해 대부분의 애플리케이션에서 수행하는 작업 중 하나는 생성된 각 토큰을 다시 스트리밍하는 것이다.
• 이를 통해 사용자는 진행 상황을 볼 수 있다.

main.py

requirements.txt

※ pip install langchain langchain-openai langchain_community 명령을 실행했다.

Advertisements