🎓 첫 코스 무료 📩 새 코스 도착 알림
← 홈으로

#3 RAG 지식베이스 구축하기lecture_script

코스: claude-customer-support · 에이전트: producer


HOOK (45초)

고객 문의가 들어올 때마다 같은 내용을 복붙하고 계시진 않나요?

"환불 기간이 며칠이냐"는 질문에 정책 문서를 뒤지고, "서비스 이용 방법"을 묻는 메시지엔 또 같은 답변을 손으로 써서 보냅니다.

Claude를 도입했는데도 엉뚱한 답변이 나오는 이유는 하나입니다. AI가 읽을 수 있는 지식베이스가 없어서입니다.

오늘 이 문제를 구조적으로 끝냅니다.


PROMISE (30초)

이 차시가 끝나면 FAQ 10항목, 환불정책, 서비스 안내 문서를 청킹 규칙에 따라 분할하고, Claude가 바로 검색할 수 있는 지식베이스 파일 세트를 직접 완성할 수 있습니다.


CORE (8–10분)

중요 개념 1 — RAG 작동 원리: "도서관 사서 모델"

설명

RAG는 세 단계로 움직입니다.

첫째, 검색(Retrieve). 고객 질문과 가장 가까운 문서 조각을 찾아옵니다.

둘째, 컨텍스트 주입(Inject). 찾아온 조각을 Claude의 프롬프트 안에 끼워 넣습니다.

셋째, 생성(Generate). Claude는 그 조각을 근거로 답변을 만들어냅니다.

이미지로 기억하기

도서관 사서를 떠올리세요. 손님이 "환불 기간 알려줘"라고 묻습니다. 사서는 서가에서 딱 맞는 페이지를 꺼내 건네줍니다. Claude는 그 페이지를 읽고 답합니다.

Claude 혼자 기억에서 꺼내는 게 아닙니다. 반드시 외부 서가, 즉 지식베이스가 필요합니다.

예시

고객: "교환 신청은 며칠 안에 해야 하나요?"

RAG 흐름: '교환 신청 기간' 키워드로 환불정책 문서 조각 검색 → 해당 조각을 프롬프트에 주입 → Claude가 "수령일로부터 7일 이내에 신청 가능합니다"라고 답변.

반례

지식베이스 없이 Claude에게 그냥 물으면 어떻게 될까요? 제 경험상 Claude는 "일반적으로 7~14일이 많습니다"처럼 일반론을 출력합니다. 내 서비스 규정과 전혀 다를 수 있습니다.

정리

RAG = 검색 → 주입 → 생성. 이 사슬에서 가장 약한 고리는 항상 지식베이스의 품질입니다.


중요 개념 2 — 청킹 단위 설계: "300~500 황금 구간"

설명

청킹은 긴 문서를 AI가 한 번에 소화할 수 있는 조각으로 자르는 작업입니다.

너무 짧으면 문맥이 사라지고, 너무 길면 노이즈가 많아져 검색 정확도가 떨어집니다.

제 경험상 300~500토큰이 대부분의 FAQ와 정책 문서에 적합합니다. 한국어 기준으로 대략 200~350자 내외입니다.

숫자 페그: 300-500

"삼오"라고 외우세요. 300 이하면 너무 얇고, 500 이상이면 너무 두껍습니다.

예시

환불정책 문서 전체가 2,000자라면 그대로 넣지 않습니다. 다음처럼 자릅니다.

각 청크는 하나의 주제만 담습니다.

반례

"우리 정책은 짧으니까 한 덩어리로 넣어도 되겠지"라는 판단은 위험합니다. 짧더라도 주제가 섞이면 검색 정확도가 크게 낮아집니다. 주제 단위로 자르는 것이 중요한입니다.

정리

청킹 원칙 두 가지. 첫째, 300~500토큰 기준. 둘째, 청크 하나에 주제 하나.


중요 개념 3 — 메타데이터 태깅: "3가지 라벨"

설명

청크를 만들었다면 라벨을 붙여야 합니다. 라벨이 있어야 검색 단계에서 원하는 청크를 빠르게 찾을 수 있습니다.

필수 메타데이터는 세 가지입니다.

  1. 유형(type): faq / refund_policy / service_guide
  2. 날짜(date): 문서 최종 수정일 (예: 2025-01-15)
  3. 우선순위(priority): high / medium / low

이미지 페그: 책 등의 스티커

도서관 책 등에 붙은 스티커를 상상하세요. 분류번호, 입고일, 열람 빈도. 그것과 똑같습니다.

예시

하나의 청크 파일은 이렇게 생겼습니다.

---
type: faq
date: 2025-01-15
priority: high
question: 환불 신청 기간은 얼마나 되나요?
---
수령일로부터 7일 이내에 환불 신청이 가능합니다.
단, 상품이 미사용 상태여야 합니다.

priority를 high로 설정하면, 검색 결과가 여러 개일 때 이 청크를 우선적으로 불러올 수 있습니다.

반례

메타데이터 없이 텍스트만 쌓으면 어떻게 될까요? 6개월 뒤 정책이 바뀌었을 때 어느 청크가 구버전인지 알 수 없습니다. 날짜 메타데이터가 없으면 관리가 불가능합니다.

정리

메타데이터 3종 세트. 유형·날짜·우선순위. 이 세 개만 있어도 지식베이스의 완성도가 크게 달라집니다.


EXERCISE (3–4분)

지금 영상을 일시정지하고 직접 만들어 보세요.

준비물: 텍스트 에디터 또는 Notion, 회원님의 실제 FAQ·환불정책·서비스 안내 문서


Step 1 — FAQ 청크 만들기 (목표: 10항목)

FAQ 문서를 열고 질문 하나 + 답변 하나를 한 쌍으로 묶습니다.

각 쌍이 300~500토큰(약 200~350자)을 넘지 않는지 확인합니다.

파일명 규칙: faq_01.txt, faq_02.txt ... faq_10.txt


Step 2 — 환불정책 청킹

환불정책 문서를 주제별로 자릅니다.

"신청 조건", "불가 항목", "처리 기간", "신청 방법" 최소 이 네 개로 분리합니다.

파일명 규칙: refund_01.txt, refund_02.txt


Step 3 — 서비스 안내 청킹

서비스 소개, 이용 방법, 주의사항을 각각 별도 파일로 만듭니다.

파일명 규칙: service_01.txt, service_02.txt


Step 4 — 메타데이터 헤더 삽입

모든 파일 맨 위에 아래 3줄을 붙여넣고 값을 채웁니다.

type: [faq / refund_policy / service_guide]
date: [오늘 날짜]
priority: [high / medium / low]

완성 기준 체크리스트

완성됐다면 영상을 다시 재생하세요.


CTA (30초)

다음 차시에서는 오늘 만든 지식베이스 파일을 Claude API에 실제로 연결합니다.

벡터 검색 설정부터 첫 번째 자동 응답 테스트까지 한 번에 진행합니다.

오늘 실습에서 막힌 부분이 있다면 어떤 단계에서 멈췄는지 댓글로 남겨주세요. 다음 영상에서 자주 나오는 케이스를 먼저 다루겠습니다.


예상 분량: 15분