[PYTHON/OPENAI] OpenAI 클래스 : embeddings 변수를 사용해 텍스트에서 임베딩 생성하기

■ OpenAI 클래스의 embeddings 변수를 사용해 텍스트에서 임베딩을 생성하는 방법을 보여준다.

• 임베딩은 자연어 처리 및 머신러닝 분야에서 널리 사용되는 개념으로, 텍스트를 컴퓨터가 처리하기 쉬운 형태로 표현하기 위한 기법이다.
• 구체적으로는 텍스트를 벡터 표현(부동소수점 배열)으로 변환한다.
• 벡터 표현은 유사한 의미를 가진 단어나 문장은 벡터 거리가 가깝고, 유사하지 않은 의미를 가진 단어나 문장은 벡터 거리가 멀어지도록 설계되어 있다.
• text-embedding-3-small 모델이 생성하는 임베딩의 차원은 1536이며, 텍스트의 길고 짧음에 관계없이 1536이 된다.

예제 코드 (PY)

requirements.txt

Advertisements