숏폼 제작 가이드 — 영상이 부담스러운 사장의 AI 파이프라인
촬영 없이, 출연 없이, 편집 없이. 글 1편을 Reels·Shorts·TikTok 3~5편으로 쪼개는 실전
"영상은 부담스럽다"에서 출발하자
먼저 솔직히 말하자. "나는 글은 쓸 줄 알지만 영상은 너무 어렵다. 어떻게 찍는지도 모르고, 내가 등장하는 것도 부담스럽다." 이 문장에 고개를 끄덕이는 사장이 주변 열 명 중 여덟이다. 스튜디오·촬영·편집 프로그램은 딴 세상 이야기처럼 느껴지고, 유튜브 크리에이터의 썰을 들으면 "저걸 내가?" 소리가 절로 난다.
그런데 2026년 현재, 도달의 상당 부분이 숏폼에서 온다. Reels·Shorts·TikTok 알고리즘은 텍스트 플랫폼보다 훨씬 공격적으로 신규 계정을 밀어준다. 지금 시작하는 사람에게 유리한 몇 안 되는 채널이다. 안 하는 건 손해지만, "촬영·출연·편집"이라는 세 가지 벽이 대부분의 사장을 막는다.
이 글은 그 세 가지 벽을 AI 도구로 각각 뚫는 방법이다. 핸드폰 카메라 한 번도 안 켜고, 얼굴 한 번도 안 비추고 숏폼을 뽑는 파이프라인이 2025년 이후로 현실이 됐다.
세 가지 포맷 — 출연 여부로 고른다
본인이 영상에 나오기 싫다면 아래 셋 중 하나를 고른다.
| 포맷 | 설명 | 주력 도구 | 난이도 |
|---|---|---|---|
| 텍스트 온 화면 | 배경 + 자막만 움직이는 영상(Kinetic Typography). 음성은 TTS 또는 무음+BGM | Vrew, CapCut | ★☆☆ |
| B-roll + 자막 | 주제 관련 스톡 영상 위에 자막. 본인 목소리·얼굴 X | Invideo AI, Pictory, Vrew | ★★☆ |
| AI 아바타 | 가상 인물이 내 스크립트를 읽어줌. 한국어 립싱크 가능 | HeyGen, Synthesia | ★★☆ |
초심자에게는 "텍스트 온 화면"을 추천한다. 가장 쉽고, 한국 Reels·Shorts에서 여전히 반응이 좋다. 지식형 숏폼 크리에이터의 다수가 이 포맷이다. 얼굴이 안 나와도 브랜드는 쌓인다 — 말투와 관점이 일관되기만 하면.
플랫폼별 공식 기준 (2026년 현재)
| 항목 | Instagram Reels | YouTube Shorts | TikTok |
|---|---|---|---|
| 최대 길이 | 90초(일부 3분) | 60초(일부 3분) | 10분까지 |
| 최적 길이 | 15~45초 | 15~60초 | 21~34초 |
| 비율 | 9:16 (1080×1920) | 9:16 (1080×1920) | 9:16 (1080×1920) |
| 캡션 | 2,200자 | 제목 100자 + 설명 | 2,200자 |
| 자막 | 자체 자동자막 제공 | 자체 자동자막 제공 | 자체 자동자막 제공 |
| 알고리즘 핵심 신호 | 시청 완료율, 재생/저장/공유 | 시청 시간, 시청 완료율 | 완료율, 반복 시청, 공유 |
공통으로 기억할 것: 세 플랫폼 모두 "몇 %까지 봤느냐(시청 완료율)" 가 가장 중요하다. 15초 영상이 30초 영상보다 알고리즘상 유리한 이유다. 짧게 만들수록 완료율 올라간다.
전체 파이프라인 — 글 1편 → 숏폼 3~5개
원문 글 (이미 쓴 블로그·웹진 글)
↓
[Step 1] Claude/Claude Code에 숏폼 스크립트 프롬프트
→ 15~45초짜리 3~5편 스크립트 생성
↓
[Step 2] Vrew 또는 CapCut에 스크립트 붙여넣기
→ 자동 자막 + 템플릿 적용 (2~5분)
↓
[Step 3] (선택) TTS 또는 본인 목소리 클론으로 내레이션
→ ElevenLabs / Vrew 내장 TTS
↓
[Step 4] (선택) B-roll 자동 삽입
→ Invideo AI / Pictory / Vrew "영상 자동 삽입"
↓
[Step 5] 사람 검수 (오탈자·박자·훅)
↓
Instagram Reels / YouTube Shorts / TikTok 업로드
핵심 프롬프트 — 글 한 편을 숏폼 3편으로 쪼개기
너는 15~45초 숏폼(Reels/Shorts) 스크립트를 쓰는 작가다.
한국 사장·창업자 독자를 대상으로 한다.
[원문]
(블로그·웹진 글 전문 붙여넣기)
[작업]
이 글을 서로 다른 각도의 숏폼 3편으로 쪼개줘.
각 편 구조:
- 제목(내부 메모용)
- 훅 (0~3초, 한국어 10~15자 이내의 강한 한 줄. 예: "사장이 쓰면 99% 망하는 계약 조항")
- 본문 3~4 포인트 (각 포인트는 자막 1줄 = 20자 이하, 총 3~4줄)
- 마무리 CTA 1줄 ("프로필 링크 확인", "저장해 두기", "댓글로 의견 공유" 중 택 1)
- 예상 길이(초)
- 배경 시각 가이드:
- 옵션 A: "검은 배경 + 흰 자막만" (텍스트 온 화면용)
- 옵션 B: B-roll 키워드 3~5개 (예: "서류 뒤적이는 손", "계산기 두드리는 장면", "사무실 창문 풍경")
각 편이 독립적으로 작동해야 한다 — 연속 시청 전제로 쓰지 말 것.
한국어로. 해시태그 금지.
이 프롬프트 하나로 글 한 편이 숏폼 3편이 된다. 한 주에 글 1편을 쓰면 숏폼은 주 3편 페이스가 유지된다.
셋업 3단계 — 무료부터 월 10만 원까지
① 최소 셋업 (무료, 주 1편)
- 스크립트: Claude 무료 버전
- 제작: CapCut 모바일 앱 (자동 자막 + 템플릿 무료)
- 음성: 무음 + 저작권 프리 BGM
- 총 비용: 0원
- 제작 시간: 글 1편당 40~60분
- 한계: CapCut 한국어 자동자막 정확도 80% 수준 — 검수 필요
② 표준 셋업 (한국 사장 추천, 주 2~3편)
- 스크립트: Claude
- 제작: Vrew (한국어 자동 자막 정확도 최상 + AI 음성 + 스톡 영상 자동 삽입)
- 최종 편집: CapCut 또는 Vrew 내장
- 총 비용: Vrew 월 1~2만 원
- 제작 시간: 글 1편당 20~30분
- Vrew가 한국 숏폼 제작에서 사실상 표준 — 한국어 TTS도 자연스럽다
③ 고급 셋업 (주 5편 이상 양산)
- 스크립트: Claude Code (폴더에 자동 생성, 플랫폼별
CLAUDE.md활용) - 긴 영상에서 숏폼 자동 추출: Opus Clip
- AI 아바타: HeyGen (얼굴 출연 대신 가상 인물)
- 최종 점검: Vrew
- 총 비용: 월 5~10만 원
- 제작 시간: 글 1편당 15분
"내 목소리는 쓰고 싶지만 얼굴은 싫다"
얼굴 출연은 부담이지만 "내 목소리"는 쓰고 싶다면 음성 클로닝이 답이다.
- 조용한 환경에서 내 목소리로 30초~1분 녹음 (핸드폰으로 충분)
- ElevenLabs 또는 Vrew에 업로드 — 음성 클론 생성
- 이후 스크립트만 넣으면 내 목소리로 읽어준다
"목소리만 나오는 채널" 도 한국 지식 콘텐츠에서 자리를 잡은 포맷이다. 얼굴 부담 없이 브랜드의 "사운드 아이덴티티"는 쌓인다.
법적 유의: 본인 목소리만 클로닝한다. 타인 목소리 클론은 음성권 침해로 2024년 한국에서도 판례가 쌓이는 중.
훅(첫 3초) — 이게 전부다
숏폼에서 시청 완료율 = 첫 3초의 훅이다. AI가 뽑는 훅은 평균값이라 반드시 사람이 덧붙여야 한다.
잘 먹히는 훅 구조 5가지 (한국 시장 기준):
- "~하면 망한다" 형 — "직원 3명 뽑을 때 이 질문 안 하면 망합니다"
- 숫자 공개 형 — "연매출 10억 사장이 꼭 쓰는 계약서 조항"
- 반전 형 — "세무사가 안 알려주는 진짜 절세법 3가지"
- 자백 형 — "저도 3년 동안 이거 몰랐습니다"
- 긴급성 형 — "지금 바로 확인하세요. 2026년부터 바뀝니다"
이 다섯 구조를 각 플랫폼 CLAUDE.md에 박아 두면 AI가 비슷한 훅을 뽑기 시작한다.
숏폼의 함정 — 정직하게
- 세로 9:16 고정. 가로·정사각형 영상은 도달 1/5로 떨어진다. 오래된 가로 영상을 돌려 쓰지 말 것
- 자막 오탈자는 치명적. TTS·자동자막은 반드시 인간이 한 번 검수. 오탈자 1개 = 알고리즘이 "저품질"로 분류
- 트렌드 음악 기본은 안 쓴다. 저작권 이슈 + 알고리즘이 원본 오디오를 더 밀어주기도 함. 처음엔 무음 + 자막 집중
- 초반 2~3주는 조회수가 처참하다. 10편쯤 올려야 알고리즘이 "이 계정이 뭘 하는 곳인지" 학습한다. 처음 10편까지는 조회 보고 낙담하지 말 것
- 얼굴 없는 숏폼은 팔로워 전환이 낮다. 업계 통념상 얼굴 출연 대비 전환율 1/2~1/3. 첫 6개월은 얼굴 없이도 충분하지만 장기적으로 얼굴 공개는 숙제
숏폼을 안 해도 되는 경우
정직하게, 아래에 해당하면 숏폼 지금 시작 안 해도 된다.
- B2B 전문 서비스업이고 타깃이 기업 의사결정자 → LinkedIn + 뉴스레터가 훨씬 효율적
- 글의 깊이 자체가 브랜드인 경우 → 숏폼이 오히려 "가벼운 브랜드"로 희석
- 3개월 안에 매출 전환이 필요 → 숏폼은 6~12개월 누적형 채널. 단기 전환은 거의 안 남
숏폼은 모든 사장이 해야 하는 채널이 아니다. 내 BM이 대중 인지도와 넓은 도달로 이익을 보는 구조일 때만 투자 가치가 있다.
같은 축의 다른 글