Published May 5, 2026Updated May 5, 2026

Kling 3.0 모션 컨트롤 — 참조 기반 AI 캐릭터 애니메이션

이미지 한 장과 참조 클립으로 모든 캐릭터에 모든 모션 적용

Kuaishou의 Kling 3.0 모션 컨트롤은 참조 클립에서 모션을 추출하여 정지된 캐릭터 이미지를 완전히 애니메이션화된 영상으로 변환합니다. 캐릭터의 JPEG 또는 PNG 이미지와 3~30초 참조 영상만 있으면, Kling이 전신 궤적, 손 제스처, 얼굴 미세 표정, 카메라 모션을 대상 피사체에 전송하면서 캐릭터의 얼굴, 의상, 정체성을 전체 영상에 걸쳐 유지합니다. 출력은 720p 또는 1080p로 참조 영상의 정확한 길이에 맞춰 생성됩니다. 캐릭터 방향 설정을 사용하여 결과가 이미지의 포즈를 따를지(최대 10초) 영상의 방향을 따를지(최대 30초)를 선택할 수 있습니다. 선택적 참조 요소를 추가하여 클립 전체에 걸쳐 커스텀 피사체를 고정할 수도 있습니다. Omni One 물리 엔진을 기반으로 하는 모션 컨트롤은 다른 애니메이션 모델이 구현할 수 없는 자연스러운 균형, 접촉 역학, 정체성 보존을 제공합니다.

Kling 3.0 모션 컨트롤은 Kuaishou가 Kling 3.0 기본 모델과 함께 출시한 전용 참조 기반 애니메이션 파이프라인으로, 표준 텍스트-비디오 및 이미지-비디오 모드와는 구별되는 방식으로 작동합니다. 프롬프트로 모션을 설명하는 대신, 3~30초 참조 클립 형태로 직접 모션을 제공합니다. 모델은 완전한 모션 궤적(신체 운동학, 손 관절 동작, 얼굴 역학, 카메라 움직임)을 추출하여 참조 이미지의 캐릭터에 재타겟팅합니다.

이 모델이 두드러지는 점은 인체 애니메이션의 어려운 부분에서의 충실도입니다. 기존에 AI 영상의 실패 지점이었던 손 제스처가 손가락 수준의 정밀도로 렌더링됩니다. 얼굴 미세 표정이 깔끔하게 전송되며, 각도 변화에도 360도 정체성 보존이 유지됩니다. Omni One 물리 엔진은 균형, 체중 이동, 천 역학, 신체와 지면 간의 접촉을 처리하므로 복잡한 안무에서도 캐릭터가 미끄러지거나 떠다니지 않습니다. 참조 영상에서 신체 일부가 가려진 경우에도 모델이 아티팩트 없이 복원합니다.

두 가지 방향 모드를 통해 소스 소재의 상호작용 방식을 제어할 수 있습니다. 캐릭터 방향=이미지는 캐릭터가 참조 이미지의 방향을 유지하며 최대 10초를 지원합니다. 원하는 포즈가 정지 이미지에서 이미 완성되어 있을 때 최적입니다. 캐릭터 방향=영상은 참조 영상의 프레이밍과 방향을 따르며 최대 30초를 지원합니다. 전신 안무, 스포츠, 또는 방향 전환이 포함된 모션에 최적입니다. 출력 해상도는 720p(스탠다드) 또는 1080p(프로)입니다. 참조 영상의 음성은 기본적으로 유지되며 클릭 한 번으로 음소거할 수 있습니다. 여러 번의 모션 컨트롤 실행에 걸쳐 장기적인 캐릭터 일관성을 유지하려면, 이전에 생성한 element_id를 지정하여 피사체를 고정할 수 있습니다. 모션 컨트롤은 Kling 3.0의 표준 시네마틱 파이프라인(멀티샷, 4K, 네이티브 오디오)과 함께 사용할 수 있습니다. 독창적인 크리에이티브 방향에는 기본 모델을, 특정 캐릭터에 전송해야 하는 특정 참조 모션이 있을 때는 모션 컨트롤을 사용하세요.

Kling 3.0 모션 컨트롤 사용 방법

캐릭터 이미지 업로드

애니메이션화할 캐릭터의 JPEG 또는 PNG 이미지를 선택합니다. 전신과 머리가 선명하게 보이고 가려지지 않은 이미지를 사용하세요. 화면 비율은 1:2.5~2.5:1, 각 변은 최소 300px, 전체 크기는 10MB 미만이어야 합니다.

참조 모션 영상 업로드

전송하려는 모션의 3~30초 클립을 추가합니다. 감지된 길이와 실시간 크레딧 비용이 즉시 표시됩니다. 720p 또는 1080p를 선택하고, 캐릭터 방향=이미지(≤10초, 이미지 포즈 유지) 또는 영상(≤30초, 영상 프레이밍 따라가기)을 선택합니다.

생성 및 다운로드

선택적으로 배경이나 스타일을 유도하는 프롬프트를 추가하고, 음향 유지 여부를 토글하고, 고급 설정에서 요소 ID가 있다면 추가합니다. '생성'을 클릭하면 Kling이 일반적으로 3~6분 내에 완료합니다. 결과 영상 URL은 24시간 동안 유효하니 신속하게 다운로드하세요.

Kling 3.0 모션 컨트롤 기술 사양

제공사	Kuaishou (Kling AI)
출시	2026년 (Kling 3.0 과 함께)
입력	참조 이미지 1장(.jpg, .jpeg, .png) + 참조 영상 1개
참조 이미지 크기	≤ 10MB; 각 변 ≥ 300px; 화면 비율 1:2.5~2.5:1
참조 영상 길이	3~30초
출력 길이	참조 영상 길이와 동일 (3~30초)
출력 해상도	720p(스탠다드) 또는 1080p(프로)
캐릭터 방향	이미지(≤10초) 또는 영상(≤30초)
음향	참조 음성 유지(기본) 또는 음소거
피사체 요소	최대 1개(video_refer 요소만 지원)
물리 엔진	Omni One — 균형, 접촉, 천 역학
정체성 보존	360° 얼굴 및 신체, 가림 복원
프롬프트	선택 사항, 최대 2500자
처리	비동기; 결과 URL 24시간 유효

Kling 3.0 모션 컨트롤이 뛰어난 이유

참조 기반 모션이 프롬프트 기반 모션을 능가

프롬프트로 모션을 설명하는 것은 불안정합니다. '우아한 피루엣'을 입력해도 매번 다른 결과가 나옵니다. 모션 컨트롤은 원하는 모션을 직접 제공할 수 있습니다. 스마트폰 클립, 댄스 영상, 스포츠 하이라이트에서 가져와 캐릭터에 재타겟팅합니다. 실제 피사체를 촬영하지 않고도 실제 퍼포먼스의 정밀도를 얻을 수 있습니다.

어려운 부분에 특화: 손, 얼굴, 물리

V3.0은 AI 캐릭터 애니메이션을 오랫동안 괴롭혀온 실패 지점들을 중점적으로 업그레이드했습니다. 바로 손 관절 동작, 얼굴 미세 표정, 물리적 접촉입니다. Omni One 물리 엔진으로 균형, 체중 이동, 가림 복원을 처리하여 댄스, 무술, 복잡한 안무가 떠다니거나 미끄러지는 아티팩트 없이 자연스럽게 렌더링됩니다.

정체성 보존과 함께 1080p에서 최대 30초

대부분의 애니메이션 모델은 5~10초가 상한선입니다. 모션 컨트롤은 참조 영상에 맞춰 최대 30초를 실행하며, 각도 변화에 걸쳐 360° 얼굴 및 신체 정체성 보존을 제공합니다. 생성 전반에 걸쳐 외형을 고정하는 선택적 피사체 요소와 결합하면, 현재 이용 가능한 가장 실무에 적합한 캐릭터 애니메이션 파이프라인이 됩니다.

Kling 3.0 모션 컨트롤 vs 기타 애니메이션 모델

Feature	Kling 3.0 모션 컨트롤	Kling 3.0 (이미지-비디오)	Runway Act-One	Wan Animate
입력	이미지 + 참조 영상	이미지 + 프롬프트	이미지 + 드라이버 영상(얼굴)	이미지 + 드라이버 영상
모션 소스	전신, 손, 얼굴, 카메라	텍스트 프롬프트	얼굴 퍼포먼스만	신체 + 얼굴
최대 길이	30초	15초	일반적으로 10초	일반적으로 5~10초
최대 해상도	1080p	4K	720p	720p
손 제스처 정밀도	높음(V3 업그레이드)	프롬프트 의존	N/A	중간
정체성 보존	360°, 가림 복원	참조 + 요소	얼굴 고정	참조 고정
물리	Omni One 엔진	물리 인식 모션	제한적	제한적
최적 용도	댄스, 스포츠, 풀 퍼포먼스	시네마틱 내러티브	토킹헤드 연기	가벼운 캐릭터 애니메이션

크리에이터들이 Kling 3.0 모션 컨트롤로 만드는 것

댄스 및 안무 영상

스마트폰으로 댄스 루틴을 촬영하여 참조 영상으로 입력하면, 아바타, 일러스트 캐릭터, 유명인 닮은꼴, 스타일화된 마스코트 등 모든 캐릭터에 재타겟팅할 수 있습니다. V3 업그레이드 덕분에 손 제스처와 발동작이 깔끔하게 전송됩니다.

스포츠 및 액션 시퀀스

스포츠 하이라이트나 파쿠르 클립을 참조로 사용하여 브랜드 마스코트나 가상 캐릭터에 모션을 적용합니다. Omni One 엔진은 일반적인 텍스트-비디오 프롬프트에서는 무너지는 빠른 방향 전환, 접촉, 전신 회전을 처리합니다.

브랜드 마스코트 애니메이션

실제 퍼포머로부터 캡처한 모션으로 정적인 브랜드 일러스트에 생동감을 불어넣습니다. 피사체 요소를 사용하면 캠페인 전반에 걸쳐 마스코트의 외형(동일한 비율, 동일한 디테일)을 고정하면서 다른 광고에는 다른 모션 클립을 사용할 수 있습니다.

뮤직비디오 퍼포먼스 삽입

아티스트의 안무를 참조하여 스타일화된 아티스트 버전에 적용하거나, 여러 컷에 걸쳐 다수의 캐릭터에 적용합니다. 네이티브 오디오 패스스루를 통해 참조 음악이나 보컬 싱크가 리마스터링 없이 결과물에 그대로 삽입됩니다.

숏폼 소셜 트렌드

자신의 캐릭터 이미지로 트렌딩 댄스, 액션, 표정을 재현합니다. 최대 30초로 거의 모든 숏폼 템플릿(TikTok, Reels, Shorts)을 커버하며, 720p는 세로형 모바일 피드에 충분한 품질입니다.

퍼포먼스 캡처 사전 시각화

mocap 스테이지 시간이 확보되기 전에 배우나 스턴트 대역의 스마트폰 품질 참조 영상을 사용하여 최종 캐릭터의 움직임을 사전에 시각화합니다. 30초에 걸친 정체성 보존 덕분에 감독이 VFX, 안무, 퍼포먼스 팀과 구체적인 내용을 논의할 수 있습니다.

Kling 3.0 모션 컨트롤 자주 묻는 질문

Kling 3.0 모션 컨트롤은 실제로 무엇을 하나요?

제공하는 참조 영상에서 캡처한 모션을 사용하여 정지된 캐릭터 이미지를 애니메이션화합니다. 프롬프트로 모션을 설명하는 대신, 원하는 방식으로 움직이는 사람(또는 사물)의 3~30초 클립(춤, 걷기, 제스처, 퍼포먼스 등)을 업로드하면 Kling이 전신 궤적, 손 제스처, 얼굴 미세 표정, 카메라 모션을 이미지의 캐릭터에 전송합니다. 출력은 캐릭터의 얼굴, 의상, 정체성을 유지하면서 참조 클립의 모션을 반영합니다.

캐릭터 방향=이미지와 =영상의 차이는 무엇인가요?

이미지 방향은 캐릭터가 참조 이미지의 방향을 유지하며(정지 이미지가 포즈를 결정) 최대 10초로 제한됩니다. 원하는 스타일이 이미지에서 이미 완성되어 있을 때 최적입니다. 영상 방향은 참조 영상의 프레이밍과 방향을 따르며 최대 30초를 지원합니다. 전신 안무, 스포츠, 또는 방향 전환이 포함된 모션에 최적입니다. 피사체 요소(element_list)를 사용하는 경우에는 영상 방향만 지원됩니다.

어떤 참조 영상이 가장 좋나요?

전신이 보이고, 안정적인 모션과 명확한 피사체를 갖춘 3~30초의 깔끔한 클립이 가장 적합합니다. 참조 영상의 캐릭터 비율이 이미지 캐릭터와 대략 일치하는 것이 좋습니다. 심한 카메라 흔들림, 여러 피사체, 혼란스러운 모션은 피해주세요. Omni One 물리 엔진은 복잡한 동작(댄스, 무술, 스포츠)을 깔끔하게 처리하며, 참조 영상에서 신체 부위가 일시적으로 가려진 경우에도 복원할 수 있습니다.

출력 길이와 가격은 어떻게 결정되나요?

출력 길이는 참조 영상의 길이(정수 초로 반올림)와 동일합니다. 가격은 품질과 길이에 따라 달라집니다. 1080p × 30초 ≈ 50크레딧, 1080p × 10초 ≈ 20크레딧이며, 짧은 길이일수록 최소 10크레딧까지 저렴해집니다. 720p는 동일 길이의 1080p의 약 75%입니다. 생성 버튼에 특정 업로드에 대한 실시간 가격이 표시됩니다.

프롬프트를 작성해야 하나요?

프롬프트는 선택 사항입니다. 비워 두면 모델이 참조 이미지와 참조 영상에서 장면을 추론합니다. 배경, 조명, 스타일에 영향을 주고 싶을 때 프롬프트를 추가하면 유용합니다(예: '시네마틱 조명, 흐릿한 도시 배경, 골든아워'). 캐릭터의 모션은 어느 경우에나 참조 영상에서 가져옵니다.

여러 번의 생성에 걸쳐 동일한 캐릭터를 계속 사용할 수 있나요?

네. 고급 설정의 피사체 요소 필드에서 이전에 생성한 element_id(Kling 커스텀 요소에서 video_refer를 사용하여 생성)를 입력할 수 있습니다. 설정하면 참조 이미지가 바뀌어도 모델이 생성 전반에 걸쳐 해당 캐릭터의 정체성을 고정합니다. 참고: 피사체 요소를 사용하려면 캐릭터 방향=영상이 필요하며, 1회 모션 컨트롤 생성당 하나의 요소만 지원됩니다.