Loading

Kling 3.0 Motion Control — Referensstyrd AI-karaktärsanimation

Koppla valfri karaktär till valfri rörelse — från en enda bild och ett referensklipp

Kling 3.0 Motion Control från Kuaishou förvandlar en stillbild av en karaktär till en fullt animerad video genom att extrahera rörelse från ett referensklipp du tillhandahåller. Ladda upp ett JPEG eller PNG av din karaktär och en 3–30 sekunder lång referensvideo, och Kling överför helkroppsbanan, handrörelser, ansiktsmikroutryck och kamerarörelse till ditt motiv — och bevarar karaktärens ansikte, outfit och identitet hela vägen igenom. Output körs i 720p eller 1080p och matchar referensvideons exakta varaktighet. Använd Karaktärsorientering för att välja om resultatet följer bildens pose (max 10 sekunder) eller videons orientering (max 30 sekunder). Lägg till ett valfritt referenselement för att låsa ett anpassat motiv genom hela klippet. Byggt på Omni One-fysikmotorn levererar Motion Control naturlig balans, kontaktdynamik och identitetsbevaring som andra animationsmodeller inte kan matcha.

Kling 3.0 Motion Control, släppt av Kuaishou tillsammans med Kling 3.0-basmodellen, är en dedikerad referensstyrd animationspipeline — skild från de vanliga text-till-video- och bild-till-video-lägena. Istället för att beskriva rörelse i en prompt tar du med din egen rörelse i form av ett 3–30 sekunders referensklipp. Modellen extraherar den fullständiga rörelsebanan — kroppkinematik, handartikulering, ansiktsdynamik och kamerarörelse — och re-targetar den till karaktären i din referensbild.

Det som utmärker den är trovärdighet i de svåra delarna av människo­animation. Handrörelser, traditionellt en felkälla för AI-video, återges med fingernoggrannhet. Ansiktsmikroutryck överförs rent med 360-graders identitetsbevaring som klarar vinkelförändringar. Omni One-fysikmotorn hanterar balans, viktöverföring, tygdynamik och kontakt mellan kroppsdelar och underlaget — så att din karaktär inte glider eller svävar genom komplex koreografi. När delar av kroppen är dold i referensen återställer modellen dem i stället för att producera artefakter.

Två orienteringslägen ger dig kontroll över hur källmaterialen interagerar. Karaktärsorientering = bild håller karaktären vänd som i din referensbild och stödjer upp till 10 sekunder — idealiskt när stillbilden redan träffar posen du vill ha. Karaktärsorientering = video följer referensvideons inramning och orientering och stödjer hela 30-sekundersintervallet — idealiskt för helkropps­koreografi, sport eller rörelse som inkluderar svängningar. Utmatningsupplösningen är 720p (standard) eller 1080p (pro). Referensvideons ljud kan behållas (standard) eller stängas av med ett klick. För långsiktig karaktärskonsistens över flera Motion Control-körningar kan du ange ett tidigare skapat element_id för att låsa motivet. Motion Control är placerat bredvid Kling 3.0:s standard cinematiska pipeline (multi-shot, 4K, native audio): använd basmodellen för originellt kreativt uttryck och använd Motion Control när du har specifik referensrörelse som du behöver överföra till en specifik karaktär.

Så här använder du Kling 3.0 Motion Control

01

Ladda upp din karaktärsbild

Välj ett JPEG eller PNG av den karaktär du vill animera — hela kroppen och huvudet tydligt synliga och ohindrade. Bildförhållande mellan 1:2,5 och 2,5:1, med varje sida minst 300px och total storlek under 10MB.

02

Ladda upp en referensrörelsevideo

Lägg till ett 3–30 sekunders klipp av rörelsen du vill överföra. Den registrerade varaktigheten och den aktuella creditkostnaden visas omedelbart. Välj 720p eller 1080p och välj Karaktärsorientering = bild (≤10s, bevara bildpose) eller video (≤30s, följ videoinramning).

03

Generera och ladda ner

Lägg valfritt till en prompt för att styra bakgrund eller stil, växla Behåll ljud, och lägg till ett Element-ID under Avancerade inställningar om du har ett. Klicka på Generera — Kling slutförs vanligtvis på 3–6 minuter. Resultatvideo-URL:er är giltiga i 24 timmar; ladda ner snabbt.

Kling 3.0 Motion Control tekniska specifikationer

LeverantörKuaishou (Kling AI)
Lansering2026 (med Kling 3.0)
Indata1 referensbild (.jpg, .jpeg, .png) + 1 referensvideo
Referensbildstorlek≤ 10MB; ≥ 300px per sida; bildförhållande 1:2,5 till 2,5:1
Referensvideons varaktighet3 till 30 sekunder
UtmatningsvaraktighetMatchar referensvideons längd (3–30s)
Utmatningsupplösning720p (std) eller 1080p (pro)
Karaktärsorienteringbild (≤10s) eller video (≤30s)
LjudBehåll referensljud (standard) eller tysta
MotivselementUpp till 1 (endast video_refer-element)
FysikmotorOmni One — balans, kontakt, tygdynamik
Identitetsbevaring360° ansikte och kropp, återställning vid ocklusion
PromptValfri, max 2500 tecken
BearbetningAsynkron; resultat-URL giltig i 24 timmar

Därför utmärker sig Kling 3.0 Motion Control

Referensstyrd rörelse slår promptbaserad rörelse

Att beskriva rörelse i en prompt är opålitligt: 'en graciös piruett' ger ett annorlunda resultat varje gång. Motion Control låter dig tillhandahålla den exakta rörelsen du vill ha — från ett telefonklipp, en dansvideo, ett sporthöjdpunkt — och re-targetar det till din karaktär. Du får precisionen hos en riktig performance utan att filma med det faktiska motivet.

Byggt för de svåra delarna: händer, ansikten, fysik

V3.0 uppgraderade specifikt de felmoder som har plågat AI-karaktärsanimation: handartikulering, ansiktsmikroutryck och fysisk kontakt. Drivet av Omni One-fysikmotorn hanterar den balans, viktöverföring och återställning vid ocklusion — så att dans, kampsport och komplex koreografi återges naturligt i stället för som svävande, glidande artefakter.

Upp till 30 sekunder i 1080p med identitetsbevaring

De flesta animationsmodeller är begränsade till 5–10 sekunder. Motion Control körs upp till 30 sekunder matchat med din referensvideo, med 360° ansikte och kropp identitetsbevaring över vinkelförändringar. Kombinerat med det valfria Motivselementet för att låsa utseende över genereringar är det den mest produktionsklara karaktärsanimationspipelinen som finns tillgänglig.

Kling 3.0 Motion Control vs. andra animationsmodeller

FeatureKling 3.0 Motion ControlKling 3.0 (Bild-till-video)Runway Act-OneWan Animate
IndataBild + referensvideoBild + promptBild + driver-video (ansikte)Bild + driver-video
RörelsekällaHela kroppen, händer, ansikte, kameraTextpromptEndast ansiktsperformanceKropp + ansikte
Max varaktighet30s15sTypiskt 10sTypiskt 5–10s
Max upplösning1080p4K720p720p
Handrörelsens trohetHög (V3-uppgradering)PromptberoendeEj tillämpligtMedel
Identitetsbevaring360°, återställning vid ocklusionReferens + elementAnsiktsförankratReferensförankrat
FysikOmni One-motorFysikmedveten rörelseBegränsadBegränsad
Bäst förDans, sport, full performanceCinematisk berättelsePratande huvud-skådespelLätt karaktärsanimation

Vad skapare bygger med Kling 3.0 Motion Control

01

Dans- och koreografivideor

Spela in en dansrutin på din telefon, släpp in den som referensvideo och re-targeta den till valfri karaktär — din avatar, en illustrerad karaktär, en kändisliknande figur eller en stiliserad maskot. Handrörelser och fotsteg överförs rent tack vare V3-uppgraderingen.

02

Sports- och aktionssekvenser

Använd ett sporthöjdpunkt eller ett parkour-klipp som referens och applicera rörelsen på en varumärkesmaskot eller en fiktiv karaktär. Omni One-motorn hanterar snabba riktningsförändringar, kontakt och helkroppsrotationer som normalt skulle falla sönder i promptbaserad text-till-video.

03

Varumärkesmaskot-animation

Aktivera en statisk varumärkesillustration med rörelse hämtad från en riktig performer. Med Motivselement kan du låsa maskotens utseende över en hel kampanj — samma proportioner, samma detaljer, olika rörelseklipp för olika annonser.

04

Musikvideo-performanceinsättningar

Referera en artists koreografi och applicera den på en stiliserad version av artisten, eller på flera karaktärer över klipp. Den native audio-genombringet betyder att referensmusiken eller vokalsyncen förblir inbäddad i resultatet utan re-mastering.

05

Kortformat sociala trender

Återskapa en trendande dans, aktion eller uttryck med din egen karaktärsbild. Upp till 30 sekunder täcker nästan varje kortformat-mall (TikTok, Reels, Shorts), och 720p är mer än tillräckligt för vertikala mobilflöden.

06

Förvisualisering för performance capture

Använd telefonkvalitativa referensfilmningar av en skådespelare eller stand-in för att förvisualisera hur en slutlig karaktär kommer att röra sig — länge innan mocap-scen-tid. Identitetsbevaring över 30 sekunder ger regissörer något konkret att diskutera med VFX-, koreografi- och performance-teamen.

Utforska relaterade AI-videomodeller

Vanliga frågor om Kling 3.0 Motion Control

Vad gör Kling 3.0 Motion Control egentligen?

Det animerar en stillbild av en karaktär med hjälp av rörelse hämtad från en referensvideo du tillhandahåller. Istället för att beskriva rörelse i en prompt laddar du upp ett 3–30 sekunders klipp av någon (eller något) som rör sig på det sätt du vill — dansar, går, gestikulerar, uppträder — och Kling överför den helkroppsbanan, handrörelser, ansiktsmikroutryck och kamerarörelse till karaktären i din bild. Utmatningen bevarar din karaktärs ansikte, outfit och identitet medan den antar referensklippets rörelse.

Vad är skillnaden mellan Karaktärsorientering = bild och = video?

Bildorientering håller karaktären vänd som i din referensbild (stillbilden styr posen) och är begränsad till 10 sekunder — idealiskt när bilden redan träffar det uttryck du vill ha. Videoorientering följer referensvideons inramning och orientering och stödjer hela 30-sekundersintervallet — idealiskt för helkropps­koreografi, sport eller rörelse som inkluderar svängningar. Om du använder ett Motivselement (element_list) stödjs bara videoorientering.

Vilken typ av referensvideo fungerar bäst?

Ett tydligt 3–30 sekunders klipp med hela kroppen synlig, stabil rörelse och ett klart motiv fungerar bäst. Referensens karaktärsproportioner bör ungefär matcha din bildkaraktär. Undvik extrem kameraskak, flera motiv eller kaotisk rörelse. Omni One-fysikmotorn hanterar komplex rörelse (dans, kampsport, sport) rent, och modellen kan återställa kroppsdelar som tillfälligt är dolda i referensen.

Hur bestäms utmatningsvaraktigheten och priset?

Utmatningsvaraktigheten matchar referensvideons varaktighet (avrundat till heltal sekunder). Prissättningen skalas med kvalitet och varaktighet: 1080p × 30s ≈ 50 credits, 1080p × 10s ≈ 20 credits, med kortare varaktigheter billigare ner till ett golv på 10 credits. 720p är ungefär 75% av 1080p vid samma varaktighet. Generera-knappen visar det aktuella priset för din specifika uppladdning.

Behöver jag skriva en prompt?

Prompt är valfri. Du kan lämna den tom och modellen drar slutsatser om scenen från din referensbild och referensvideo. Att lägga till en prompt är användbart när du vill påverka bakgrunden, belysningen eller stilen — till exempel 'cinematisk belysning, suddig stadslig bakgrund, gyllene timme'. Karaktärens rörelse kommer från referensvideon oavsett.

Kan jag fortsätta använda samma karaktär över flera genereringar?

Ja. Fältet Motivselement under Avancerade inställningar låter dig ange ett element_id du tidigare skapat (via Kling Custom Element med video_refer). När det är inställt låser modellen den karaktärens identitet över genereringar, även om referensbilden ändras. Obs: Motivselement kräver Karaktärsorientering = video, och bara ett element stöds per Motion Control-generering.