Como fazer a trend de beisebol AI coreano: guia completo de vídeo
A trend de beisebol AI coreano transforma uma única selfie em um clipe de 5 segundos que parece uma transmissão ao vivo da KBO filmando fãs nas arquibancadas. O fluxo de trabalho mais rápido e convincente de maio de 2026: gere o fotograma com GPT Image 2 no modo de raciocínio para bloquear a identidade facial, depois anime com Seedance 2 usando referências de múltiplas imagens e áudio nativo do estádio — sem overdub no CapCut.
O que é a trend de beisebol AI coreano?
A trend de beisebol AI coreano é um formato de vídeo viral onde uma única selfie é transformada em um clipe hiper-realista de 5 segundos que imita uma transmissão ao vivo da KBO (Organização de Beisebol da Coreia). O visual parece exatamente uma câmera de estádio da SPOTV ou SBS Sports varrendo as arquibancadas e capturando um fã ao acaso. O formato se espalhou pelo TikTok, Instagram Reels e YouTube Shorts durante a primavera de 2026, com veículos regionais — incluindo Khaleej Times e El Imparcial — publicando tutoriais em maio de 2026.
Origem — o clipe de 5 segundos que alcançou 15 milhões de views no X
A trend remonta a um clipe de 5 segundos publicado no X mostrando uma jovem assistindo ao beisebol coreano. A publicação acumulou mais de 15 milhões de views antes de os espectadores perceberem que ela era completamente gerada por IA. A revelação — que um plano hiper-realista de "fã nas arquibancadas" podia ser fabricado a partir de uma única imagem — transformou o formato em uma trend participativa viral em questão de dias.
Que pistas fazem um quadro parecer de uma transmissão KBO real?
Um quadro parece autêntico quando carrega a assinatura visual de como a SPOTV e SBS Sports realmente filmam as arquibancadas:
- Compressão de teleobjetiva. O enquadramento com tele achata a profundidade e cria a multidão densa e em camadas das câmeras de transmissão. Enquadramento angular de "celular" destrói o efeito instantaneamente.
- Proporção 16:9. O beisebol coreano é filmado em 16:9 de transmissão. Gerar em 9:16 sacrifica a sensação característica.
- Bokeh de transmissão. Luzes do estádio e gráficos do placar se desfocam em suaves círculos atrás do sujeito.
- Gradação de cor fria. As transmissões KBO reais têm meios-tons em azul-verde-índigo frio com preservação de tons quentes de pele.
- Expressão espontânea em ação. Sorrisos posados parecem falsos. Piscadas, leve surpresa, momentos bebendo — isso parece real.
- Gráfico de placar quase invisível. Uma sobreposição fantasma no canto cementa a sensação de transmissão sem precisar ser legível.

Os dois modelos que você vai usar
Este guia usa dois modelos da LoveGen AI em sequência. GPT Image 2 gera o fotograma estático e bloqueia a identidade facial; Seedance 2 anima o fotograma em vídeo com áudio de estádio sincronizado. A maioria dos guias concorrentes combina um modelo de imagem mais antigo com o Kling 3. Essa combinação tem dois problemas: a identidade facial deriva quando o movimento começa, e o áudio do estádio precisa ser adicionado em um editor separado.

Como as combinações se comparam
| Combinação | Preservação de identidade | Áudio nativo | Duração máx. | Notas |
|---|---|---|---|---|
| GPT Image 2 + Seedance 2 (este guia) | Modo raciocínio + 4 referências | Sim, passe único | 15 s | Recomendado; sem overdub manual |
| ChatGPT/Gemini + Kling 3 | Somente imagem única | Não, requer overdub no CapCut | 10 s | Alternativa mais comum |
| Template Kapwing | Bloqueado por template | Somente auto-gerado | 5–10 s | Mais fácil; menos controle |
| Dreamina (CapCut) um clique | Bloqueado por template | Nenhum | Somente imagem | Apenas foto, sem etapa de vídeo |
Passo 1 — Gere o fotograma KBO com GPT Image 2
Abra GPT Image 2 na LoveGen AI, anexe uma foto de referência clara e bem iluminada sua (de frente, expressão neutra, sem óculos escuros), ative o modo de raciocínio e cole o prompt abaixo. Regenere duas ou três vezes e escolha o fotograma que melhor preserva seus traços.
Use o prompt em inglês exatamente como está — os modelos de IA interpretam melhor as instruções em inglês.
O prompt de imagem (copiar e colar)
Create an ultra-realistic, cinematic, candid KBO baseball broadcast screenshot of the subject in the attached reference photo. Capture the moment as if a live TV camera on SPOTV or SBS Sports panned across the stadium crowd and caught the subject mid-reaction.
Identity (highest priority):
- Preserve exact facial geometry from the reference: same face shape, eye spacing, nose, lips, jawline, skin tone, hairline
- Maintain natural skin texture with visible pores and natural asymmetry
- No skin smoothing, no beauty filter, no feature standardization
Subject framing:
- Medium-close shot, head and shoulders, subject in the center-left of the frame
- Caught mid-action: blinking, slight surprise, soft involuntary smile, or holding an iced americano partway to the lips
- Wearing a pastel knit cardigan or oversized hoodie and a team cap or visor
- Holding an iced drink in a clear plastic cup with condensation
Setting:
- KBO stadium seating bowl, golden hour light raking from the upper-right
- Lively Korean baseball crowd in the background, color-blocked pink, teal, and white team merchandise
- Slight motion blur on background fans (telephoto compression)
Technical:
- 16:9 broadcast frame, telephoto lens compression, shallow depth of field, f/2.8 feel
- Broadcast color grading: cool teal-and-indigo midtones with warm complexion preservation
- Subtle bokeh on stadium lights and a faint ghosted scoreboard graphic in the upper-right corner
- Photojournalism style, 35mm look, candid imperfection, broadcast quality
- No readable on-screen text, no watermarks, no English captions
Avoid: studio lighting, posed expression, perfect symmetry, smoothed skin, legible scoreboard text, posed smile
Por que o modo de raciocínio importa para a identidade facial
GPT Image 2 foi lançado em 21 de abril de 2026 como o primeiro modelo de imagem mainstream com raciocínio nativo — ele planeja, pesquisa na web quando útil e verifica seu próprio output antes de renderizar. Para esta trend, isso faz uma coisa que importa: mantém a geometria facial entre regenerações. O modelo também reporta ~99% de precisão em nível de caractere em escritas latinas, CJK, hindi e bengali e suporta outputs de até 4K.
Ajustes do prompt que fazem diferença
| Ajuste | O que definir | Por que importa |
|---|---|---|
| Compressão tele | "telephoto lens compression, shallow depth of field" | A maior pista visual de transmissão; enquadramento angular destrói a autenticidade |
| Direção da luz | "golden hour light raking from the upper-right" | Luz lateral parece natural de estádio; luz frontal plana parece estúdio |
| Bebida na mão | "iced americano in a clear plastic cup with condensation" | Posição da mão quebra o enquadramento simétrico "posado" |
| Roupa | "pastel knit cardigan", "team cap or visor" | Textura e silhueta específicas superam o vago "casual" |
| Enquadramento | "head and shoulders, center-left of frame" | Sujeito descentrado imita como câmeras de transmissão encontram rostos |
| Expressão | "mid-action: blinking, slight surprise, soft involuntary smile" | Ação em andamento sempre supera expressão terminada |
| Fãs de fundo | "color-blocked pink, teal, and white team merchandise" | Blocos de cor parecem cultura fã coreana |
| Sobreposição placar | "faint ghosted scoreboard graphic in the upper-right corner" | Bloqueio visual de transmissão; NÃO deve ser legível |
Passo 2 — Anime o fotograma com Seedance 2
Abra Seedance 2 na LoveGen AI, mude para o modo imagem-para-vídeo, faça upload do fotograma do Passo 1 como referência primária e adicione até três frames de referência extras se tiver (selfie de frente, ângulo de três quartos, expressão alternativa). Cole o prompt de animação.
O prompt de animação (copiar e colar)
Animate the supplied KBO baseball broadcast still into a 5-second clip. Use the attached reference frames to lock the subject's facial identity across every video frame — no drift, no morphing.
Motion (subtle, broadcast-realistic):
- Subject blinks twice naturally within the clip
- Slight gaze shift toward the camera, then back to the field
- Small involuntary smile or eyebrow lift mid-clip
- One micro-movement of the drink-holding hand (no full sip)
- Background crowd: ambient micro-motion only — heads turning slowly, hands occasionally raising, no synchronized cheering
Camera (broadcast feel):
- Static shot with very slight handheld drift, no zoom, no pan
- Maintain the source still's telephoto compression and shallow depth of field
- Preserve the bokeh and the ghosted scoreboard graphic in the upper-right
Audio (native, single-pass, no overdub):
- Ambient KBO stadium background: distant crowd murmur, occasional clap, faint chant in Korean from the upper deck
- Soft synthesized broadcast organ riff barely audible underneath
- No commentary, no English announcer voice, no music bed
- Audio peaks fall on natural visual beats (subject blink, distant bat crack)
Output:
- 5 seconds, 16:9, 1080p or higher
- Single continuous shot, no cuts
- Match the source still's color grade exactly: cool teal-and-indigo midtones with warm complexion preservation
Uso de referência multi-imagem para preservar a identidade no movimento
Seedance 2 suporta até quatro imagens de referência para guiar uma única geração, que é a defesa mais confiável contra a deriva de identidade entre frames de vídeo. Combine o fotograma do GPT Image 2 com dois ou três ângulos diferentes do seu rosto. O modelo resolve a geometria do sujeito a partir do consenso entre esses frames.

Áudio nativo — sincronize o barulho do estádio em um único passe
Seedance 2 gera áudio sincronizado no mesmo passe que o vídeo, o que significa que os gritos do estádio, o murmúrio ambiente e os efeitos sonoros se alinham automaticamente com a ação na tela. Especifique as pistas de áudio no prompt — "ambient stadium murmur, occasional clap, faint chant in Korean" — e o modelo produzirá a faixa de áudio nativamente. Mantenha as descrições de áudio do prompt curtas e concretas — Seedance 2 segue pistas de som específicas melhor que o vago "stadium sounds".
Passo 3 — Exporte e publique no TikTok, Reels e Shorts
A trend vive em feeds verticais, mas a estética de transmissão depende do enquadramento horizontal. A jogada certa é gerar em 16:9 e depois recortar.
Proporção, duração e resolução por plataforma
- TikTok: 9:16 vertical, 1080×1920, de cinco a sete segundos. Recorte a fonte 16:9 com o sujeito centralizado.
- Instagram Reels: 9:16, mesmas dimensões, de cinco a dez segundos. Reels recompensa um gancho no primeiro segundo.
- YouTube Shorts: 9:16 até 60 segundos, mas de cinco a oito segundos é ótimo para este formato.
Renderize o fotograma do GPT Image 2 na configuração mais alta disponível (suporta até 4K), depois deixe Seedance 2 gerar em 1080p.
Convenções de legenda que ampliam o alcance da trend
Três padrões de legenda funcionam consistentemente:
- A legenda da revelação — finja que o clipe é real, deixe a IA ser a piada nos comentários.
- A legenda de divulgação — declare IA desde o início, use a hashtag de marca da trend.
- A legenda de participação — convide os espectadores a experimentar o mesmo fluxo de trabalho.
Modos de falha comuns e soluções
| Sintoma | Causa provável | Solução |
|---|---|---|
| Rosto muda entre frame 1 e 5 | Referência de vídeo de imagem única | Adicione três frames de referência em Seedance 2 |
| Pele parece plástica ou retocada | Viés de beleza padrão | Adicione "natural skin texture, visible pores, no skin smoothing" ao prompt |
| Texto do placar coreano parece rabisco | Prompt pediu texto legível | Mude para "faint ghosted scoreboard graphic, no readable text" |
| Olhar morto fixo na câmera | Expressão posada no prompt | Substitua por "mid-action: blinking, slight surprise" |
| Áudio não corresponde à ação | Prompt de áudio vago | Especifique pistas concretas ("distant clap, faint chant in Korean") |
| Recorte vertical corta o rosto | Gerado nativamente em 9:16 | Gere em 16:9, recorte no editor com sujeito centralizado |
| Fãs de fundo parecem congelados | Prompt suprimiu todo movimento | Permita "ambient micro-motion — heads turning slowly" |
| Sujeito veste a camisa errada | Prompt muito específico sobre time | Remova referências a times concretos |
Combinações alternativas se não puder usar GPT Image 2 + Seedance 2
Se GPT Image 2 ou Seedance 2 não estiver disponível no seu plano, duas alternativas chegam mais perto da mesma qualidade:
- Combine GPT Image 2 com Kling 3 — mantém o fotograma forte mas perde o áudio nativo. Você precisará fazer overdub de sons de estádio no CapCut.
- Explore todos os modelos de vídeo atuais no hub de modelos de vídeo da LoveGen AI — Sora 2, Veo 4 e Wan 2.2 suportam imagem-para-vídeo, mas somente Seedance 2 inclui áudio nativo.
A trend de beisebol AI coreano é ética e legal?
A trend tem participação ampla, mas dois aspectos merecem reflexão antes de publicar. Primeiro, a crítica da Elle India apontou como o comportamento padrão de filtro de beleza das ferramentas de template impõe padrões irrealistas. A linguagem do prompt neste guia é o contraponto direto. Segundo, nunca gere a imagem de outra pessoa sem consentimento. Divulgue a geração por IA ao publicar.
Perguntas frequentes
P: O que é a trend de beisebol AI coreano? R: A trend de beisebol AI coreano é um formato viral onde usuários transformam uma selfie em um clipe de 5 segundos que parece uma câmera de TV ao vivo da KBO capturando-os nas arquibancadas. A estética imita as transmissões da SPOTV ou SBS Sports — compressão de teleobjetiva, bokeh de transmissão, expressões espontâneas. O formato explodiu no TikTok, Instagram Reels e YouTube Shorts na primavera de 2026.
P: Como começou a trend de beisebol AI coreano? R: A trend remonta a um clipe de 5 segundos publicado no X no início de 2026 mostrando uma jovem assistindo ao beisebol coreano. A publicação acumulou mais de 15 milhões de views antes de os espectadores perceberem que ela era completamente gerada por IA. A revelação transformou o formato em uma trend participativa viral em dias.
P: Qual é o melhor prompt de IA para o look de transmissão de beisebol coreano? R: A estrutura de prompt mais forte começa com "ultra-realistic, cinematic, candid, KBO baseball broadcast screenshot," nomeia o sujeito, fixa a identidade facial ("preserve exact facial geometry, no beauty filter"), especifica roupa e um acessório e bloqueia o enquadramento. O prompt completo de copiar e colar para GPT Image 2 está no Passo 1 deste guia.
P: Como manter meu rosto igual em múltiplas gerações de IA? R: Use o modo de raciocínio do GPT Image 2 para o fotograma estático — ele planeja e verifica a geometria facial antes de desenhar. Para o passo de vídeo, dê ao Seedance 2 até quatro imagens de referência do seu rosto de diferentes ângulos. A deriva de identidade é a falha mais comum da trend; a referência multi-imagem é a maior correção.
P: Posso adicionar áudio de estádio sem overdub no CapCut? R: Sim — Seedance 2 gera áudio sincronizado no mesmo passe que o vídeo. Especifique as pistas de áudio no prompt ("ambient stadium murmur, distant chant"). Fluxos de trabalho mais antigos que combinam GPT Image 2 com Kling 3 requerem overdub manual em um editor separado.
P: Quanto pode durar um vídeo da trend no Seedance 2? R: Seedance 2.0 gera vídeos de até 15 segundos em um único passe. Para a trend, cinco segundos é o ponto ideal — corresponde ao ritmo do clipe viral original e cabe na duração mais reproduzida do TikTok.
P: Qual proporção usar para TikTok ou Instagram Reels? R: Gere em 16:9 (a proporção nativa de transmissão) para máximo realismo, depois recorte para 9:16 no editor com o sujeito centralizado. Gerar diretamente em 9:16 sacrifica a sensação de transmissão porque a TV KBO real é filmada em 16:9.
P: Por que meu rosto gerado por IA parece suave ou artificial? R: O viés de beleza padrão em muitos modelos de imagem suaviza a pele e padroniza traços — exatamente o que a Elle India apontou. Contorne adicionando "natural skin texture, visible pores, no skin smoothing, candid imperfection, photojournalism style" ao prompt. O modo de raciocínio honra essas restrições negativas de forma mais consistente.
P: Quanto custa fazer um vídeo da trend na LoveGen AI? R: Um fluxo de trabalho típico é uma geração de GPT Image 2 (geralmente com duas ou três regenerações) mais um passe de imagem-para-vídeo no Seedance 2. O preço exato depende do seu nível de plano; consulte a página de preços para as tarifas atuais.
P: É ético publicar vídeos de fãs KBO gerados por IA? R: A trend tem participação ampla, mas duas preocupações merecem atenção. Primeiro, o comportamento padrão de filtro de beleza das ferramentas de template empurra padrões irrealistas — contraponha com as dicas de textura e imperfeição deste guia. Segundo, nunca gere a imagem de outra pessoa sem consentimento e divulgue a geração por IA ao publicar.
P: Posso usar a trend com esportes além do beisebol KBO? R: A receita visual se transfere para qualquer esporte com um look de transmissão reconhecível — futebol J.League no Japão, beisebol NPB, futebol K League, basquete NBA. Substitua "KBO baseball" pela liga alvo, nomeie o broadcaster real e ajuste a roupa e a paleta de cores da multidão. O fluxo de trabalho de dois modelos — GPT Image 2 para o fotograma, Seedance 2 para o movimento e áudio — permanece igual.
