#3 RAG 지식베이스 구축하기lecture_script
코스: claude-customer-support · 에이전트: producer
HOOK (45초)
고객 문의가 들어올 때마다 같은 내용을 복붙하고 계시진 않나요?
"환불 기간이 며칠이냐"는 질문에 정책 문서를 뒤지고, "서비스 이용 방법"을 묻는 메시지엔 또 같은 답변을 손으로 써서 보냅니다.
Claude를 도입했는데도 엉뚱한 답변이 나오는 이유는 하나입니다. AI가 읽을 수 있는 지식베이스가 없어서입니다.
오늘 이 문제를 구조적으로 끝냅니다.
PROMISE (30초)
이 차시가 끝나면 FAQ 10항목, 환불정책, 서비스 안내 문서를 청킹 규칙에 따라 분할하고, Claude가 바로 검색할 수 있는 지식베이스 파일 세트를 직접 완성할 수 있습니다.
CORE (8–10분)
중요 개념 1 — RAG 작동 원리: "도서관 사서 모델"
설명
RAG는 세 단계로 움직입니다.
첫째, 검색(Retrieve). 고객 질문과 가장 가까운 문서 조각을 찾아옵니다.
둘째, 컨텍스트 주입(Inject). 찾아온 조각을 Claude의 프롬프트 안에 끼워 넣습니다.
셋째, 생성(Generate). Claude는 그 조각을 근거로 답변을 만들어냅니다.
이미지로 기억하기
도서관 사서를 떠올리세요. 손님이 "환불 기간 알려줘"라고 묻습니다. 사서는 서가에서 딱 맞는 페이지를 꺼내 건네줍니다. Claude는 그 페이지를 읽고 답합니다.
Claude 혼자 기억에서 꺼내는 게 아닙니다. 반드시 외부 서가, 즉 지식베이스가 필요합니다.
예시
고객: "교환 신청은 며칠 안에 해야 하나요?"
RAG 흐름: '교환 신청 기간' 키워드로 환불정책 문서 조각 검색 → 해당 조각을 프롬프트에 주입 → Claude가 "수령일로부터 7일 이내에 신청 가능합니다"라고 답변.
반례
지식베이스 없이 Claude에게 그냥 물으면 어떻게 될까요? 제 경험상 Claude는 "일반적으로 7~14일이 많습니다"처럼 일반론을 출력합니다. 내 서비스 규정과 전혀 다를 수 있습니다.
정리
RAG = 검색 → 주입 → 생성. 이 사슬에서 가장 약한 고리는 항상 지식베이스의 품질입니다.
중요 개념 2 — 청킹 단위 설계: "300~500 황금 구간"
설명
청킹은 긴 문서를 AI가 한 번에 소화할 수 있는 조각으로 자르는 작업입니다.
너무 짧으면 문맥이 사라지고, 너무 길면 노이즈가 많아져 검색 정확도가 떨어집니다.
제 경험상 300~500토큰이 대부분의 FAQ와 정책 문서에 적합합니다. 한국어 기준으로 대략 200~350자 내외입니다.
숫자 페그: 300-500
"삼오"라고 외우세요. 300 이하면 너무 얇고, 500 이상이면 너무 두껍습니다.
예시
환불정책 문서 전체가 2,000자라면 그대로 넣지 않습니다. 다음처럼 자릅니다.
- 청크 1: 환불 신청 조건 (구매 후 7일 이내, 미사용 상품)
- 청크 2: 환불 불가 항목 (디지털 콘텐츠, 사용 개봉 상품)
- 청크 3: 환불 처리 기간 (신청 후 영업일 3~5일)
- 청크 4: 환불 신청 방법 (고객센터 이메일 또는 마이페이지)
각 청크는 하나의 주제만 담습니다.
반례
"우리 정책은 짧으니까 한 덩어리로 넣어도 되겠지"라는 판단은 위험합니다. 짧더라도 주제가 섞이면 검색 정확도가 크게 낮아집니다. 주제 단위로 자르는 것이 중요한입니다.
정리
청킹 원칙 두 가지. 첫째, 300~500토큰 기준. 둘째, 청크 하나에 주제 하나.
중요 개념 3 — 메타데이터 태깅: "3가지 라벨"
설명
청크를 만들었다면 라벨을 붙여야 합니다. 라벨이 있어야 검색 단계에서 원하는 청크를 빠르게 찾을 수 있습니다.
필수 메타데이터는 세 가지입니다.
- 유형(type): faq / refund_policy / service_guide
- 날짜(date): 문서 최종 수정일 (예: 2025-01-15)
- 우선순위(priority): high / medium / low
이미지 페그: 책 등의 스티커
도서관 책 등에 붙은 스티커를 상상하세요. 분류번호, 입고일, 열람 빈도. 그것과 똑같습니다.
예시
하나의 청크 파일은 이렇게 생겼습니다.
---
type: faq
date: 2025-01-15
priority: high
question: 환불 신청 기간은 얼마나 되나요?
---
수령일로부터 7일 이내에 환불 신청이 가능합니다.
단, 상품이 미사용 상태여야 합니다.
priority를 high로 설정하면, 검색 결과가 여러 개일 때 이 청크를 우선적으로 불러올 수 있습니다.
반례
메타데이터 없이 텍스트만 쌓으면 어떻게 될까요? 6개월 뒤 정책이 바뀌었을 때 어느 청크가 구버전인지 알 수 없습니다. 날짜 메타데이터가 없으면 관리가 불가능합니다.
정리
메타데이터 3종 세트. 유형·날짜·우선순위. 이 세 개만 있어도 지식베이스의 완성도가 크게 달라집니다.
EXERCISE (3–4분)
지금 영상을 일시정지하고 직접 만들어 보세요.
준비물: 텍스트 에디터 또는 Notion, 회원님의 실제 FAQ·환불정책·서비스 안내 문서
Step 1 — FAQ 청크 만들기 (목표: 10항목)
FAQ 문서를 열고 질문 하나 + 답변 하나를 한 쌍으로 묶습니다.
각 쌍이 300~500토큰(약 200~350자)을 넘지 않는지 확인합니다.
파일명 규칙: faq_01.txt, faq_02.txt ... faq_10.txt
Step 2 — 환불정책 청킹
환불정책 문서를 주제별로 자릅니다.
"신청 조건", "불가 항목", "처리 기간", "신청 방법" 최소 이 네 개로 분리합니다.
파일명 규칙: refund_01.txt, refund_02.txt
Step 3 — 서비스 안내 청킹
서비스 소개, 이용 방법, 주의사항을 각각 별도 파일로 만듭니다.
파일명 규칙: service_01.txt, service_02.txt
Step 4 — 메타데이터 헤더 삽입
모든 파일 맨 위에 아래 3줄을 붙여넣고 값을 채웁니다.
type: [faq / refund_policy / service_guide]
date: [오늘 날짜]
priority: [high / medium / low]
완성 기준 체크리스트
- [ ] FAQ 파일 10개 이상
- [ ] 환불정책 파일 2개 이상
- [ ] 서비스 안내 파일 2개 이상
- [ ] 전체 파일에 메타데이터 헤더 포함
완성됐다면 영상을 다시 재생하세요.
CTA (30초)
다음 차시에서는 오늘 만든 지식베이스 파일을 Claude API에 실제로 연결합니다.
벡터 검색 설정부터 첫 번째 자동 응답 테스트까지 한 번에 진행합니다.
오늘 실습에서 막힌 부분이 있다면 어떤 단계에서 멈췄는지 댓글로 남겨주세요. 다음 영상에서 자주 나오는 케이스를 먼저 다루겠습니다.
예상 분량: 15분