
Kling 3.0 Motion Control — Animação de Personagens IA Guiada por Referência
Fixe Qualquer Personagem a Qualquer Movimento — Com Uma Única Imagem e um Clipe de Referência
O Kling 3.0 Motion Control da Kuaishou transforma uma imagem estática de personagem em um vídeo totalmente animado extraindo o movimento de um clipe de referência que você fornece. Envie um JPEG ou PNG do seu personagem e um vídeo de referência de 3 a 30 segundos, e o Kling transfere a trajetória de corpo inteiro, os gestos de mãos, as microexpressões faciais e o movimento de câmera para o seu sujeito — preservando o rosto, a roupa e a identidade do personagem durante todo o processo. A saída é em 720p ou 1080p e corresponde à duração exata do vídeo de referência. Use Orientação do Personagem para escolher se o resultado segue a pose da imagem (máx. 10 segundos) ou a orientação do vídeo (máx. 30 segundos). Adicione um elemento de referência opcional para fixar um sujeito personalizado em todo o clipe. Construído sobre o motor de física Omni One, o Motion Control oferece equilíbrio natural, dinâmica de contato e preservação de identidade que outros modelos de animação não conseguem igualar.
O Kling 3.0 Motion Control, lançado pela Kuaishou junto com o modelo base Kling 3.0, é um pipeline de animação dedicado guiado por referência — distinto dos modos padrão de texto para vídeo e imagem para vídeo. Em vez de descrever o movimento em um prompt, você traz seu próprio movimento na forma de um clipe de referência de 3 a 30 segundos. O modelo extrai a trajetória de movimento completa — cinemática corporal, articulação das mãos, dinâmica facial e movimento de câmera — e a redireciona para o personagem na sua imagem de referência.
O que o diferencia é a fidelidade nas partes difíceis da animação humana. Os gestos de mãos, tradicionalmente um ponto de falha para vídeo IA, são renderizados com precisão no nível dos dedos. As microexpressões faciais são transferidas com clareza, com preservação de identidade de 360 graus que sobrevive a mudanças de ângulo. O motor de física Omni One cuida do equilíbrio, transferência de peso, dinâmica de tecidos e contato entre partes do corpo e o chão — para que seu personagem não deslize ou flutue por coreografias complexas. Quando partes do corpo estão ocluídas na referência, o modelo as recupera em vez de produzir artefatos.
Dois modos de orientação dão controle sobre como os materiais de origem interagem. Orientação do Personagem = imagem mantém o personagem voltado como está na sua imagem de referência e suporta até 10 segundos — ideal quando a imagem estática já acerta a pose desejada. Orientação do Personagem = vídeo segue o enquadramento e a orientação do vídeo de referência e suporta o intervalo completo de 30 segundos — ideal para coreografia de corpo inteiro, esportes ou qualquer movimento que inclua giros. A resolução de saída é 720p (padrão) ou 1080p (pro). O áudio do vídeo de referência pode ser mantido (padrão) ou silenciado com um clique. Para consistência de personagem de longa duração em múltiplas execuções do Motion Control, você pode fornecer um element_id criado anteriormente para fixar o sujeito. O Motion Control fica ao lado do pipeline cinematográfico padrão do Kling 3.0 (multitomada, 4K, áudio nativo): use o modelo base para direção criativa original e use o Motion Control quando tiver um movimento de referência específico que precise transferir para um personagem específico.
Como Usar o Kling 3.0 Motion Control
Envie Sua Imagem de Personagem
Escolha um JPEG ou PNG do personagem que você quer animar — corpo inteiro e cabeça claramente visíveis, sem obstruções. Proporção entre 1:2.5 e 2.5:1, com cada lado de pelo menos 300px e tamanho total abaixo de 10MB.
Envie um Vídeo de Movimento de Referência
Adicione um clipe de 3 a 30 segundos do movimento que você quer transferir. A duração detectada e o custo em créditos em tempo real aparecem imediatamente. Escolha 720p ou 1080p, e selecione Orientação do Personagem = imagem (≤10s, preservar pose da imagem) ou vídeo (≤30s, seguir enquadramento do vídeo).
Gere e Baixe
Opcionalmente adicione um prompt para guiar o fundo ou o estilo, ative Manter Som e adicione um ID de Elemento em Configurações Avançadas se tiver um. Clique em Gerar — o Kling geralmente conclui em 3 a 6 minutos. As URLs de vídeo resultantes são válidas por 24 horas; faça o download prontamente.
Especificações Técnicas do Kling 3.0 Motion Control
| Provedor | Kuaishou (Kling AI) |
| Lançamento | 2026 (com Kling 3.0) |
| Entradas | 1 imagem de referência (.jpg, .jpeg, .png) + 1 vídeo de referência |
| Tamanho da Imagem de Referência | ≤ 10MB; ≥ 300px por lado; proporção 1:2.5 a 2.5:1 |
| Duração do Vídeo de Referência | 3 a 30 segundos |
| Duração da Saída | Corresponde à duração do vídeo de referência (3–30s) |
| Resolução da Saída | 720p (padrão) ou 1080p (pro) |
| Orientação do Personagem | imagem (≤10s) ou vídeo (≤30s) |
| Som | Manter áudio de referência (padrão) ou silenciar |
| Elemento de Sujeito | Até 1 (somente elementos video_refer) |
| Motor de Física | Omni One — equilíbrio, contato, dinâmica de tecidos |
| Preservação de Identidade | Rosto e corpo 360°, recuperação de oclusão |
| Prompt | Opcional, máx. 2500 caracteres |
| Processamento | Assíncrono; URL do resultado válida por 24 horas |
Por Que o Kling 3.0 Motion Control se Destaca
Movimento Guiado por Referência Supera Movimento por Prompt
Descrever o movimento em um prompt é frágil: 'um elegante pirueta' produz um resultado diferente a cada vez. O Motion Control permite que você forneça o movimento exato que deseja — de um clipe de celular, um vídeo de dança, um destaque esportivo — e o redirecione para o seu personagem. Você obtém a precisão de uma performance real sem filmar com o sujeito real.
Construído para as Partes Difíceis: Mãos, Rostos, Física
O V3.0 atualizou especificamente os pontos de falha que têm afetado a animação de personagens IA: articulação das mãos, microexpressões faciais e contato físico. Alimentado pelo motor de física Omni One, ele lida com equilíbrio, transferência de peso e recuperação de oclusão — para que dança, artes marciais e coreografias complexas sejam renderizadas de forma natural em vez de como artefatos flutuantes ou deslizantes.
Até 30 Segundos a 1080p Com Preservação de Identidade
A maioria dos modelos de animação tem limite de 5 a 10 segundos. O Motion Control funciona por até 30 segundos correspondendo ao seu vídeo de referência, com preservação de identidade de rosto e corpo em 360° através de mudanças de ângulo. Combinado com o Elemento de Sujeito opcional para fixar a aparência entre gerações, é o pipeline de animação de personagens mais pronto para produção disponível.
Kling 3.0 Motion Control vs Outros Modelos de Animação
| Feature | Kling 3.0 Motion Control | Kling 3.0 (Imagem para Vídeo) | Runway Act-One | Wan Animate |
|---|---|---|---|---|
| Entrada | Imagem + vídeo de referência | Imagem + prompt | Imagem + vídeo guia (rosto) | Imagem + vídeo guia |
| Fonte de Movimento | Corpo inteiro, mãos, rosto, câmera | Prompt de texto | Apenas performance facial | Corpo + rosto |
| Duração Máxima | 30s | 15s | 10s típico | 5–10s típico |
| Resolução Máxima | 1080p | 4K | 720p | 720p |
| Fidelidade de Gestos de Mãos | Alta (atualização V3) | Depende do prompt | N/A | Média |
| Preservação de Identidade | 360°, recuperação de oclusão | Referência + elementos | Ancorada ao rosto | Ancorada à referência |
| Física | Motor Omni One | Movimento com consciência física | Limitada | Limitada |
| Ideal Para | Dança, esportes, performance completa | Narrativa cinematográfica | Atuação de cabeça falante | Animação leve de personagens |
O Que os Criadores Constroem com o Kling 3.0 Motion Control
Vídeos de Dança e Coreografia
Capture uma rotina de dança no seu celular, envie como vídeo de referência e redirecione para qualquer personagem — seu avatar, um personagem ilustrado, uma semelhança de celebridade ou um mascote estilizado. Os gestos de mãos e o trabalho de pés são transferidos com clareza graças à atualização V3.
Esportes e Sequências de Ação
Use um destaque esportivo ou um clipe de parkour como referência e aplique o movimento a um mascote de marca ou a um personagem fictício. O motor Omni One lida com mudanças rápidas de direção, contato e rotações de corpo inteiro que normalmente falhariam em texto para vídeo por prompt.
Animação de Mascote de Marca
Ative uma ilustração de marca estática com movimento capturado de um performer real. Com o Elemento de Sujeito, você pode fixar a aparência do mascote em toda uma campanha — mesmas proporções, mesmos detalhes, diferentes clipes de movimento para diferentes anúncios.
Inserções de Performance em Videoclipes Musicais
Referencie a coreografia de um artista e aplique-a a uma versão estilizada do artista, ou a múltiplos personagens em diferentes cortes. O repasse de áudio nativo significa que a música de referência ou a sincronização vocal permanece incorporada no resultado sem necessidade de remasterização.
Tendências em Redes Sociais de Formato Curto
Recrie uma dança, ação ou expressão em alta usando sua própria imagem de personagem. Até 30 segundos cobre quase todos os modelos de formato curto (TikTok, Reels, Shorts), e 720p é mais que suficiente para feeds móveis verticais.
Pré-visualização para Captura de Performance
Use imagens de referência de qualidade de celular de um ator ou dublê para pré-visualizar como um personagem final se moverá — muito antes do tempo no estúdio de mocap. A preservação de identidade ao longo de 30 segundos dá aos diretores algo concreto para discutir com as equipes de VFX, coreografia e performance.
Explore Modelos de Vídeo IA Relacionados
Kling 3.0
O modelo base Kling 3.0 com direção multitomada, saída 4K e áudio nativo.
Kling 2.5 Turbo
O modelo 1080p otimizado para velocidade da Kuaishou para produção rápida em volume a 1080p.
Kling v2.1
Imagem para vídeo com controle de primeiro/último quadro para transições guiadas.
Happy Horse 1.0
Transformer unificado melhor classificado com referência para vídeo e áudio em 6 idiomas.

Veo 3.1
O modelo 1080p do Google DeepMind com quadros para vídeo e áudio sincronizado.

Sora 2
O modelo 1080p da OpenAI com clipes de até 20 segundos e Cameos.
Perguntas Frequentes sobre Kling 3.0 Motion Control
O que o Kling 3.0 Motion Control realmente faz?
Ele anima uma imagem estática de personagem usando o movimento capturado de um vídeo de referência que você fornece. Em vez de descrever o movimento em um prompt, você envia um clipe de 3 a 30 segundos de alguém (ou algo) se movendo do jeito que você quer — dançando, caminhando, gesticulando, performando — e o Kling transfere essa trajetória de corpo inteiro, gestos de mãos, microexpressões faciais e movimento de câmera para o personagem na sua imagem. A saída mantém o rosto, a roupa e a identidade do seu personagem enquanto adota o movimento do clipe de referência.
Qual é a diferença entre Orientação do Personagem = imagem e = vídeo?
A orientação de imagem mantém o personagem voltado como está na sua imagem de referência (a imagem estática guia a pose) e tem limite de 10 segundos — ideal quando a imagem já acerta o visual desejado. A orientação de vídeo segue o enquadramento e a orientação do vídeo de referência e suporta o intervalo completo de 30 segundos — ideal para coreografia de corpo inteiro, esportes ou movimentos que incluam giros. Se você usar um Elemento de Sujeito (element_list), apenas a orientação de vídeo é suportada.
Que tipo de vídeo de referência funciona melhor?
Um clipe limpo de 3 a 30 segundos com o corpo inteiro visível, movimento fluido e um sujeito claro funciona melhor. As proporções do personagem na referência devem ser aproximadamente compatíveis com as do seu personagem na imagem. Evite tremor extremo de câmera, múltiplos sujeitos ou movimento caótico. O motor de física Omni One lida com movimentos complexos (dança, artes marciais, esportes) de forma limpa, e o modelo consegue recuperar partes do corpo que estejam temporariamente ocluídas na referência.
Como são determinados a duração da saída e o preço?
A duração da saída corresponde à duração do vídeo de referência (arredondada para segundos inteiros). O preço escala com qualidade e duração: 1080p × 30s ≈ 50 créditos, 1080p × 10s ≈ 20 créditos, com durações menores mais baratas até um mínimo de 10 créditos. 720p custa aproximadamente 75% do 1080p na mesma duração. O botão Gerar mostra o preço em tempo real para o seu envio específico.
Preciso escrever um prompt?
O prompt é opcional. Você pode deixá-lo em branco e o modelo inferirá a cena a partir da sua imagem de referência e do vídeo de referência. Adicionar um prompt é útil quando você quer influenciar o fundo, a iluminação ou o estilo — por exemplo, 'iluminação cinematográfica, fundo urbano desfocado, hora dourada'. O movimento do personagem vem do vídeo de referência de qualquer forma.
Posso continuar usando o mesmo personagem em múltiplas gerações?
Sim. O campo Elemento de Sujeito em Configurações Avançadas permite que você forneça um element_id que criou anteriormente (via Kling Custom Element usando video_refer). Quando definido, o modelo fixa a identidade daquele personagem em todas as gerações, mesmo que a imagem de referência mude. Observação: o Elemento de Sujeito requer Orientação do Personagem = vídeo, e apenas um elemento é suportado por geração do Motion Control.