벡터 DB — AI가 긴 문서를 어떻게 기억하는지 원리 (Pinecone·Chroma)Claude나 ChatGPT에 긴 문서를 넣으면 잘 처리하는데, 문서가 수백 개, 수천 개가 되면 한 번에 다 넣을 수가 없습니다. 컨텍스트 윈도우에 한계가 있기 때문입니다. 그렇다고 매번 관련 문서를 사람이 골라서 넣는 것도 현실적이지 않습니다. 벡터 데이터베이스가 이 문제를 해결합니다. RAG 글에서 잠깐 언급했는데, 이번에는 원리부터 실제 사용법까지 깊게 들어가보겠습니다.벡터가 뭔지부터 짚으면벡터는 숫자의 배열입니다. 텍스트를 벡터로 변환한다는 건 문장이나 단어를 수백 개에서 수천 개의 숫자로 표현한다는 뜻입니다. 이 변환 과정을 임베딩(Embedding)이라고 합니다.임베딩의 핵심은 의미가 비슷한 텍스트는 비슷한..