인공지능과 협업할 때 가장 빈번하게 발생하는 문제는 AI가 내놓은 결과물이 ‘나의 의도’와는 맞지만 ‘나의 스타일’과는 동떨어져 있다는 점이다.
RLHF의 첫 번째 단계인 SFT(Supervised Fine-Tuning, 지도 미세 조정)는 바로 이 지점을 해결하는 핵심 열쇠이다. 비개발자가 실무에서 SFT 원리를 활용한다는 것은, AI에게 막연한 창작을 맡기는 대신 내가 원하는 정답의 ‘형태’와 ‘질감’을 미리 학습시키는 과정을 의미한다.
이를 통해 AI는 단순한 범용 모델을 넘어, 사용자의 고유한 문체와 업무 형식을 완벽하게 재현하는 개인 맞춤형 비서로 거듭나게 된다는 것이다.
1. 인공지능 협업의 기초, SFT식 프롬프팅과 레퍼런스의 마법
SFT는 비유하자면 ‘붕어빵 틀’을 만드는 과정과 같다. 틀이 없는 상태에서 밀가루 반죽을 부으면 형태를 잡을 수 없지만, 정교하게 깎인 틀이 있다면 어떤 반죽을 넣어도 균일하고 아름다운 붕어빵을 얻을 수 있다. 비개발자 사용자가 AI에게 제공하는 레퍼런스(참조 자료)가 바로 이 붕어빵 틀 역할을 수행한다는 것이다.
많은 이들이 AI에게 “창의적인 블로그 글을 써줘”라고 명령하지만, 이는 AI에게 아무런 도안 없이 집을 지으라는 것과 같다. 대신 “내가 예전에 쓴 이 포스팅의 구조와 어투를 참고해서 새로운 주제로 써줘”라고 말하는 순간, AI는 SFT 단계에서 인간 전문가가 제공한 모범 답안을 학습하듯 사용자의 데이터를 분석하기 시작함. 이 과정을 거치면 AI의 답변 품질은 평범한 수준에서 ‘전문가 수준’으로 수직 상승하게 된다는 것이다.
2. 실무에서 바로 써먹는 SFT 기반 인공지능 협업 기술 3가지
비개발자 직군에서 AI를 나의 분신처럼 활용하기 위해 반드시 적용해야 할 SFT 응용 전략은 다음과 같다.
ㄱ. Few-Shot(예시 제공) 기법의 극대화
AI에게 지시를 내리기 전, 최소 2~3개의 모범 사례를 먼저 보여주는 방식이다. 이는 AI가 단어의 선택, 문장의 길이, 논리의 전개 방식을 즉각적으로 파악하도록 돕는다.
- 과거에 성공적이었던 캠페인 문구 3개를 샘플로 제시했음
- 각 샘플의 공통점(예: 질문으로 시작함, 수치를 강조함)을 설명했음
- AI가 해당 패턴을 학습하여 새로운 상품에 적용하도록 유도했음
ㄴ. 페르소나와 제약 조건의 정밀 설계
SFT는 단순히 데이터를 주는 것이 아니라 ‘환경’을 설정하는 것이기도 하다. AI에게 구체적인 직업적 배경과 성격, 그리고 절대 하지 말아야 할 행동을 정의해 주어야 한다는 것이다.
- “너는 15년 경력의 까칠하지만 유능한 서비스 기획자야”라고 역할을 부여했음
- “전문 용어는 지양하고, 중학생도 이해할 수 있는 비유를 사용해”라고 지침을 주었음
- 답변의 길이를 공백 포함 1,000자 내외로 제한하여 정보의 밀도를 높였음
ㄷ. 단계별 지시(Chain of Thought)를 통한 논리 정렬
복잡한 업무를 한 번에 시키지 않고, 인간이 문제를 해결하는 논리적 단계를 나누어 지시하는 방식이다. 이는 AI가 중간 과정에서 발생할 수 있는 오류를 스스로 점검하게 만든다.
- 먼저 주제에 대한 목차를 작성하게 하여 전체 흐름을 승인했음
- 각 목차에 들어갈 핵심 키워드를 사용자가 직접 지정했음
- 승인된 목차를 바탕으로 본문을 한 섹션씩 완성해 나갔음
3. 인공지능 협업 생산성을 결정짓는 데이터 정제 노하우
AI에게 주는 데이터가 ‘쓰레기’라면 결과물도 ‘쓰레기’가 나올 수밖에 없다(Garbage In, Garbage Out). 비개발자가 SFT 전략을 성공시키기 위해서는 자신이 가진 업무 자산을 잘 정리해 두어야 한다는 것이다.
- 글쓰기 자산: 본인이 직접 쓴 기획서, 블로그 글, 이메일 양식 등을 모아둘 필요가 있음
- 피드백 자산: AI와의 대화 중 가장 만족스러웠던 결과물과 그때 사용한 프롬프트를 기록해 두었음
- 금기어 목록: 회사 내부적으로 사용하지 않는 용어나 브랜드 가이드라인을 문서화했음
4. 인공지능 협업의 심화 단계 예고
SFT 원리를 활용한 협업이란 AI에게 ‘나의 뇌 구조’를 복제해 주는 과정이다. 비개발자는 기술적인 코딩을 몰라도, 좋은 예시를 선별하고 명확한 지침을 내리는 능력만으로도 AI의 성능을 최고 수준으로 끌어올릴 수 있다는 것이다.
- AI는 백지상태에서 시작한다는 사실을 잊지 말아야 함
- 좋은 레퍼런스가 최고의 프롬프트라는 점을 명심했음
- 다음 3편에서는 이렇게 생성된 결과물들을 어떻게 평가하고 최종적으로 완성시키는지, RLHF의 꽃인 ‘보상 모델’과 ‘강화학습’ 실무 적용법을 다룰 예정임