
Kling 3.0 Motion Control — Referensstyrd AI-karaktärsanimation
Koppla valfri karaktär till valfri rörelse — från en enda bild och ett referensklipp
Kling 3.0 Motion Control från Kuaishou förvandlar en stillbild av en karaktär till en fullt animerad video genom att extrahera rörelse från ett referensklipp du tillhandahåller. Ladda upp ett JPEG eller PNG av din karaktär och en 3–30 sekunder lång referensvideo, och Kling överför helkroppsbanan, handrörelser, ansiktsmikroutryck och kamerarörelse till ditt motiv — och bevarar karaktärens ansikte, outfit och identitet hela vägen igenom. Output körs i 720p eller 1080p och matchar referensvideons exakta varaktighet. Använd Karaktärsorientering för att välja om resultatet följer bildens pose (max 10 sekunder) eller videons orientering (max 30 sekunder). Lägg till ett valfritt referenselement för att låsa ett anpassat motiv genom hela klippet. Byggt på Omni One-fysikmotorn levererar Motion Control naturlig balans, kontaktdynamik och identitetsbevaring som andra animationsmodeller inte kan matcha.
Kling 3.0 Motion Control, släppt av Kuaishou tillsammans med Kling 3.0-basmodellen, är en dedikerad referensstyrd animationspipeline — skild från de vanliga text-till-video- och bild-till-video-lägena. Istället för att beskriva rörelse i en prompt tar du med din egen rörelse i form av ett 3–30 sekunders referensklipp. Modellen extraherar den fullständiga rörelsebanan — kroppkinematik, handartikulering, ansiktsdynamik och kamerarörelse — och re-targetar den till karaktären i din referensbild.
Det som utmärker den är trovärdighet i de svåra delarna av människoanimation. Handrörelser, traditionellt en felkälla för AI-video, återges med fingernoggrannhet. Ansiktsmikroutryck överförs rent med 360-graders identitetsbevaring som klarar vinkelförändringar. Omni One-fysikmotorn hanterar balans, viktöverföring, tygdynamik och kontakt mellan kroppsdelar och underlaget — så att din karaktär inte glider eller svävar genom komplex koreografi. När delar av kroppen är dold i referensen återställer modellen dem i stället för att producera artefakter.
Två orienteringslägen ger dig kontroll över hur källmaterialen interagerar. Karaktärsorientering = bild håller karaktären vänd som i din referensbild och stödjer upp till 10 sekunder — idealiskt när stillbilden redan träffar posen du vill ha. Karaktärsorientering = video följer referensvideons inramning och orientering och stödjer hela 30-sekundersintervallet — idealiskt för helkroppskoreografi, sport eller rörelse som inkluderar svängningar. Utmatningsupplösningen är 720p (standard) eller 1080p (pro). Referensvideons ljud kan behållas (standard) eller stängas av med ett klick. För långsiktig karaktärskonsistens över flera Motion Control-körningar kan du ange ett tidigare skapat element_id för att låsa motivet. Motion Control är placerat bredvid Kling 3.0:s standard cinematiska pipeline (multi-shot, 4K, native audio): använd basmodellen för originellt kreativt uttryck och använd Motion Control när du har specifik referensrörelse som du behöver överföra till en specifik karaktär.
Så här använder du Kling 3.0 Motion Control
Ladda upp din karaktärsbild
Välj ett JPEG eller PNG av den karaktär du vill animera — hela kroppen och huvudet tydligt synliga och ohindrade. Bildförhållande mellan 1:2,5 och 2,5:1, med varje sida minst 300px och total storlek under 10MB.
Ladda upp en referensrörelsevideo
Lägg till ett 3–30 sekunders klipp av rörelsen du vill överföra. Den registrerade varaktigheten och den aktuella creditkostnaden visas omedelbart. Välj 720p eller 1080p och välj Karaktärsorientering = bild (≤10s, bevara bildpose) eller video (≤30s, följ videoinramning).
Generera och ladda ner
Lägg valfritt till en prompt för att styra bakgrund eller stil, växla Behåll ljud, och lägg till ett Element-ID under Avancerade inställningar om du har ett. Klicka på Generera — Kling slutförs vanligtvis på 3–6 minuter. Resultatvideo-URL:er är giltiga i 24 timmar; ladda ner snabbt.
Kling 3.0 Motion Control tekniska specifikationer
| Leverantör | Kuaishou (Kling AI) |
| Lansering | 2026 (med Kling 3.0) |
| Indata | 1 referensbild (.jpg, .jpeg, .png) + 1 referensvideo |
| Referensbildstorlek | ≤ 10MB; ≥ 300px per sida; bildförhållande 1:2,5 till 2,5:1 |
| Referensvideons varaktighet | 3 till 30 sekunder |
| Utmatningsvaraktighet | Matchar referensvideons längd (3–30s) |
| Utmatningsupplösning | 720p (std) eller 1080p (pro) |
| Karaktärsorientering | bild (≤10s) eller video (≤30s) |
| Ljud | Behåll referensljud (standard) eller tysta |
| Motivselement | Upp till 1 (endast video_refer-element) |
| Fysikmotor | Omni One — balans, kontakt, tygdynamik |
| Identitetsbevaring | 360° ansikte och kropp, återställning vid ocklusion |
| Prompt | Valfri, max 2500 tecken |
| Bearbetning | Asynkron; resultat-URL giltig i 24 timmar |
Därför utmärker sig Kling 3.0 Motion Control
Referensstyrd rörelse slår promptbaserad rörelse
Att beskriva rörelse i en prompt är opålitligt: 'en graciös piruett' ger ett annorlunda resultat varje gång. Motion Control låter dig tillhandahålla den exakta rörelsen du vill ha — från ett telefonklipp, en dansvideo, ett sporthöjdpunkt — och re-targetar det till din karaktär. Du får precisionen hos en riktig performance utan att filma med det faktiska motivet.
Byggt för de svåra delarna: händer, ansikten, fysik
V3.0 uppgraderade specifikt de felmoder som har plågat AI-karaktärsanimation: handartikulering, ansiktsmikroutryck och fysisk kontakt. Drivet av Omni One-fysikmotorn hanterar den balans, viktöverföring och återställning vid ocklusion — så att dans, kampsport och komplex koreografi återges naturligt i stället för som svävande, glidande artefakter.
Upp till 30 sekunder i 1080p med identitetsbevaring
De flesta animationsmodeller är begränsade till 5–10 sekunder. Motion Control körs upp till 30 sekunder matchat med din referensvideo, med 360° ansikte och kropp identitetsbevaring över vinkelförändringar. Kombinerat med det valfria Motivselementet för att låsa utseende över genereringar är det den mest produktionsklara karaktärsanimationspipelinen som finns tillgänglig.
Kling 3.0 Motion Control vs. andra animationsmodeller
| Feature | Kling 3.0 Motion Control | Kling 3.0 (Bild-till-video) | Runway Act-One | Wan Animate |
|---|---|---|---|---|
| Indata | Bild + referensvideo | Bild + prompt | Bild + driver-video (ansikte) | Bild + driver-video |
| Rörelsekälla | Hela kroppen, händer, ansikte, kamera | Textprompt | Endast ansiktsperformance | Kropp + ansikte |
| Max varaktighet | 30s | 15s | Typiskt 10s | Typiskt 5–10s |
| Max upplösning | 1080p | 4K | 720p | 720p |
| Handrörelsens trohet | Hög (V3-uppgradering) | Promptberoende | Ej tillämpligt | Medel |
| Identitetsbevaring | 360°, återställning vid ocklusion | Referens + element | Ansiktsförankrat | Referensförankrat |
| Fysik | Omni One-motor | Fysikmedveten rörelse | Begränsad | Begränsad |
| Bäst för | Dans, sport, full performance | Cinematisk berättelse | Pratande huvud-skådespel | Lätt karaktärsanimation |
Vad skapare bygger med Kling 3.0 Motion Control
Dans- och koreografivideor
Spela in en dansrutin på din telefon, släpp in den som referensvideo och re-targeta den till valfri karaktär — din avatar, en illustrerad karaktär, en kändisliknande figur eller en stiliserad maskot. Handrörelser och fotsteg överförs rent tack vare V3-uppgraderingen.
Sports- och aktionssekvenser
Använd ett sporthöjdpunkt eller ett parkour-klipp som referens och applicera rörelsen på en varumärkesmaskot eller en fiktiv karaktär. Omni One-motorn hanterar snabba riktningsförändringar, kontakt och helkroppsrotationer som normalt skulle falla sönder i promptbaserad text-till-video.
Varumärkesmaskot-animation
Aktivera en statisk varumärkesillustration med rörelse hämtad från en riktig performer. Med Motivselement kan du låsa maskotens utseende över en hel kampanj — samma proportioner, samma detaljer, olika rörelseklipp för olika annonser.
Musikvideo-performanceinsättningar
Referera en artists koreografi och applicera den på en stiliserad version av artisten, eller på flera karaktärer över klipp. Den native audio-genombringet betyder att referensmusiken eller vokalsyncen förblir inbäddad i resultatet utan re-mastering.
Kortformat sociala trender
Återskapa en trendande dans, aktion eller uttryck med din egen karaktärsbild. Upp till 30 sekunder täcker nästan varje kortformat-mall (TikTok, Reels, Shorts), och 720p är mer än tillräckligt för vertikala mobilflöden.
Förvisualisering för performance capture
Använd telefonkvalitativa referensfilmningar av en skådespelare eller stand-in för att förvisualisera hur en slutlig karaktär kommer att röra sig — länge innan mocap-scen-tid. Identitetsbevaring över 30 sekunder ger regissörer något konkret att diskutera med VFX-, koreografi- och performance-teamen.
Utforska relaterade AI-videomodeller
Kling 3.0
Kling 3.0-basmodellen med multi-shot-regi, 4K-utmatning och native audio.
Kling 2.5 Turbo
Kuaishous hastighetsoptimerade 1080p-modell för snabb 1080p-volymproduktion.
Kling v2.1
Bild-till-video med kontroll av första/sista bildruta för styrda övergångar.
Happy Horse 1.0
Topprangerad unified Transformer med referens-till-video och 6-språkigt ljud.

Veo 3.1
Google DeepMinds 1080p-modell med bildrutor-till-video och synkroniserat ljud.

Sora 2
OpenAIs 1080p-modell med upp till 20-sekunders klipp och Cameos.
Vanliga frågor om Kling 3.0 Motion Control
Vad gör Kling 3.0 Motion Control egentligen?
Det animerar en stillbild av en karaktär med hjälp av rörelse hämtad från en referensvideo du tillhandahåller. Istället för att beskriva rörelse i en prompt laddar du upp ett 3–30 sekunders klipp av någon (eller något) som rör sig på det sätt du vill — dansar, går, gestikulerar, uppträder — och Kling överför den helkroppsbanan, handrörelser, ansiktsmikroutryck och kamerarörelse till karaktären i din bild. Utmatningen bevarar din karaktärs ansikte, outfit och identitet medan den antar referensklippets rörelse.
Vad är skillnaden mellan Karaktärsorientering = bild och = video?
Bildorientering håller karaktären vänd som i din referensbild (stillbilden styr posen) och är begränsad till 10 sekunder — idealiskt när bilden redan träffar det uttryck du vill ha. Videoorientering följer referensvideons inramning och orientering och stödjer hela 30-sekundersintervallet — idealiskt för helkroppskoreografi, sport eller rörelse som inkluderar svängningar. Om du använder ett Motivselement (element_list) stödjs bara videoorientering.
Vilken typ av referensvideo fungerar bäst?
Ett tydligt 3–30 sekunders klipp med hela kroppen synlig, stabil rörelse och ett klart motiv fungerar bäst. Referensens karaktärsproportioner bör ungefär matcha din bildkaraktär. Undvik extrem kameraskak, flera motiv eller kaotisk rörelse. Omni One-fysikmotorn hanterar komplex rörelse (dans, kampsport, sport) rent, och modellen kan återställa kroppsdelar som tillfälligt är dolda i referensen.
Hur bestäms utmatningsvaraktigheten och priset?
Utmatningsvaraktigheten matchar referensvideons varaktighet (avrundat till heltal sekunder). Prissättningen skalas med kvalitet och varaktighet: 1080p × 30s ≈ 50 credits, 1080p × 10s ≈ 20 credits, med kortare varaktigheter billigare ner till ett golv på 10 credits. 720p är ungefär 75% av 1080p vid samma varaktighet. Generera-knappen visar det aktuella priset för din specifika uppladdning.
Behöver jag skriva en prompt?
Prompt är valfri. Du kan lämna den tom och modellen drar slutsatser om scenen från din referensbild och referensvideo. Att lägga till en prompt är användbart när du vill påverka bakgrunden, belysningen eller stilen — till exempel 'cinematisk belysning, suddig stadslig bakgrund, gyllene timme'. Karaktärens rörelse kommer från referensvideon oavsett.
Kan jag fortsätta använda samma karaktär över flera genereringar?
Ja. Fältet Motivselement under Avancerade inställningar låter dig ange ett element_id du tidigare skapat (via Kling Custom Element med video_refer). När det är inställt låser modellen den karaktärens identitet över genereringar, även om referensbilden ändras. Obs: Motivselement kräver Karaktärsorientering = video, och bara ett element stöds per Motion Control-generering.