■ 임의 벡터로 텍스트를 표현하는 방법을 보여준다.
※ 네트워크 문제로 인해 모델을 다운로드할 수 없는 경우, 임시 방편으로 임의의 벡터를 사용하여 텍스트를 표현하면서도 테스트를 완료할 수 있다.
※ 벡터는 가짜 벡터이므로 검색 결과에 의미적 유사성이 반영되지 않는다는 점에 유의한다.
▶ main.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
import random stringList = [ "Artificial intelligence was founded as an academic discipline in 1956.", "Alan Turing was the first person to conduct substantial research in AI.", "Born in Maida Vale, London, Turing was raised in southern England.", ] stringVectorList = [[random.uniform(-1, 1) for _ in range(768)] for _ in stringList] # float list list itemList = [ {"id" : i, "vector" : stringVectorList[i], "text" : stringList[i], "subject" : "history"} for i in range(len(stringVectorList)) ] print("Data has", len(itemList), "entities, each with fields :", itemList[0].keys()) print("Vector dim :", len(itemList[0]["vector"])) """ Data has 3 entities, each with fields : dict_keys(['id', 'vector', 'text', 'subject']) Vector dim : 768 """ |