ChatGPT나 Claude에게 최근 뉴스를 물어보면 "제 학습 데이터 기준으로는..."이라는 답변이 나올 때가 있습니다. LLM은 특정 시점까지의 데이터로만 학습되기 때문에 그 이후의 정보는 모릅니다. 그런데 기업 환경에서 AI를 쓰다 보면 최신 데이터나 내부 문서를 참조해서 답변해줬으면 하는 상황이 생깁니다. 이 문제를 해결하는 대표적인 방식이 RAG입니다.RAG가 뭔지 정확히 짚으면RAG는 Retrieval-Augmented Generation의 약자입니다. 번역하면 검색 증강 생성입니다. 모델이 답변을 생성할 때 학습 데이터에만 의존하지 않고, 외부 데이터베이스나 문서에서 관련 내용을 실시간으로 검색해서 그걸 참조해 답변을 만드는 방식입니다.구조를 단순하게 표현하면 이렇습니다. 사용자가 질문을 입..