[PYTHON/LANGCHAIN] _GeneratorContextManager 클래스 : total_tokens 속성을 사용해 단일 채팅 모델의 스트리밍 모드에서 전체 토큰 사용량 구하기

■ _GeneratorContextManager 클래스의 total_tokens 속성을 사용해 단일 채팅 모델의 스트리밍 모드에서 전체 토큰 사용량을 구하는 방법을 보여준다.

※ 현재 스트리밍 모드에서는 비용 정보를 사용할 수 없으나 토큰 수는 사용할 수 있다.
※ 이는 현재 스트리밍 모드에서 모델명이 청크를 통해 전파되지 않고, 모델명이 올바른 가격을 조회하는 데 사용되기 때문이다.
※ OPENAI_API_KEY 환경 변수 값은 .env 파일에 정의한다.

main.py

requirements.txt

※ pip install python-dotenv langchain-community langchain-openai 명령을 실행했다.

Advertisements