Cómo hacer el trend de béisbol AI coreano: guía completa de video
El trend de béisbol AI coreano convierte una sola selfie en un clip de 5 segundos que parece una transmisión en vivo de la KBO grabando a los fans en las gradas. El flujo de trabajo más rápido y convincente de mayo de 2026: genera el fotograma con GPT Image 2 en modo razonamiento para bloquear la identidad facial, luego anímalo con Seedance 2 usando referencias de múltiples imágenes y audio nativo del estadio — sin overdub en CapCut.
¿Qué es el trend de béisbol AI coreano?
El trend de béisbol AI coreano es un formato de video viral donde una sola selfie se transforma en un clip hiperrealista de 5 segundos que imita una transmisión en vivo de la KBO (Organización de Béisbol de Corea). El resultado parece exactamente una cámara de estadio de SPOTV o SBS Sports barriendo las gradas y captando a un fan al azar. El formato se extendió por TikTok, Instagram Reels y YouTube Shorts durante la primavera de 2026, con medios regionales — incluyendo Khaleej Times y El Imparcial — publicando tutoriales en mayo de 2026.
Origen — el clip de 5 segundos que alcanzó 15 millones de views en X
El trend se remonta a un clip de 5 segundos publicado en X que mostraba a una joven viendo béisbol coreano. La publicación acumuló más de 15 millones de views antes de que los espectadores se dieran cuenta de que la chica era completamente generada por IA. El giro — que un plano de "fan en las gradas" podía fabricarse a partir de una sola imagen — convirtió el formato en un trend participativo en cuestión de días. A mediados de mayo de 2026, prensa tecnológica de India, el Golfo y Latinoamérica ya publicaban sus propias guías.
¿Qué claves hacen que un encuadre parezca de una transmisión KBO real?
Un encuadre parece auténtico cuando lleva la firma visual de cómo SPOTV y SBS Sports realmente graban las gradas. Las claves son específicas y se suman:
- Compresión de teleobjetivo. El encuadre con tele aplana la profundidad y crea la densa multitud en capas de las cámaras de transmisión. El encuadre angular de "teléfono" destruye el efecto al instante.
- Relación de aspecto 16:9. El béisbol coreano se graba en 16:9 de difusión. Generar en 9:16 sacrifica la sensación característica — es mejor renderizar en 16:9 y recortar después.
- Bokeh de difusión. Las luces del estadio y los gráficos del marcador se desdibujan en suaves círculos detrás del sujeto.
- Color frío. Las transmisiones KBO reales tienen tonos medios en azul-verde-índigo frío con preservación cálida de la tez.
- Expresión casual de acción. Las sonrisas posadas se ven falsas. Pestañeos, ligera sorpresa, momentos bebiendo — eso parece real.
- Gráfico de marcador apenas visible. Una superposición en pantalla fantasma en la esquina cementa la sensación de transmisión sin necesidad de ser legible.

Los dos modelos que vas a usar
Esta guía usa dos modelos de LoveGen AI en secuencia. GPT Image 2 genera el fotograma estático y bloquea la identidad facial; Seedance 2 anima el fotograma en video con audio de estadio sincronizado. La mayoría de guías rivales — incluyendo el tutorial de Cyberlink/MyEdit y el tutorial de Kapwing — combinan un modelo de imagen antiguo con Kling 3. Esa combinación tiene dos problemas sin resolver: la identidad facial se desvía cuando empieza el movimiento, y el audio del estadio hay que sobredublar en un editor separado.

Cómo se comparan las combinaciones
| Combinación | Preservación de identidad | Audio nativo | Duración máx. | Notas |
|---|---|---|---|---|
| GPT Image 2 + Seedance 2 (esta guía) | Modo razonamiento + 4 referencias | Sí, un solo pase | 15 s | Recomendado; sin overdub manual |
| ChatGPT/Gemini + Kling 3 | Solo imagen única | No, requiere overdub en CapCut | 10 s | Alternativa más común |
| Plantilla Kapwing | Bloqueada por plantilla | Solo auto-generado | 5–10 s | Más fácil; menos control |
| Dreamina (CapCut) un clic | Bloqueada por plantilla | Ninguno | Solo imagen | Solo foto, sin paso de video |
El modo razonamiento es el diferenciador en el lado de imagen. La publicación de lanzamiento de OpenAI describe GPT Image 2 como el primer modelo de imagen mainstream que "piensa antes de dibujar" — planea la composición, busca en la web cuando es necesario y comprueba su propia salida, que es lo que hace que la identidad facial se mantenga entre regeneraciones.
Paso 1 — Genera el fotograma KBO con GPT Image 2
Abre GPT Image 2 en LoveGen AI, adjunta una foto de referencia tuya clara y bien iluminada (de frente, expresión neutral, sin gafas de sol), activa el modo razonamiento y pega el prompt de abajo. Regenera dos o tres veces y elige el fotograma que mejor preserve tus rasgos — ese es el que usarás en el Paso 2.
Usa el prompt en inglés tal como está — los modelos de IA interpretan mejor las instrucciones en inglés.
El prompt de imagen (copiar y pegar)
Create an ultra-realistic, cinematic, candid KBO baseball broadcast screenshot of the subject in the attached reference photo. Capture the moment as if a live TV camera on SPOTV or SBS Sports panned across the stadium crowd and caught the subject mid-reaction.
Identity (highest priority):
- Preserve exact facial geometry from the reference: same face shape, eye spacing, nose, lips, jawline, skin tone, hairline
- Maintain natural skin texture with visible pores and natural asymmetry
- No skin smoothing, no beauty filter, no feature standardization
Subject framing:
- Medium-close shot, head and shoulders, subject in the center-left of the frame
- Caught mid-action: blinking, slight surprise, soft involuntary smile, or holding an iced americano partway to the lips
- Wearing a pastel knit cardigan or oversized hoodie and a team cap or visor
- Holding an iced drink in a clear plastic cup with condensation
Setting:
- KBO stadium seating bowl, golden hour light raking from the upper-right
- Lively Korean baseball crowd in the background, color-blocked pink, teal, and white team merchandise
- Slight motion blur on background fans (telephoto compression)
Technical:
- 16:9 broadcast frame, telephoto lens compression, shallow depth of field, f/2.8 feel
- Broadcast color grading: cool teal-and-indigo midtones with warm complexion preservation
- Subtle bokeh on stadium lights and a faint ghosted scoreboard graphic in the upper-right corner
- Photojournalism style, 35mm look, candid imperfection, broadcast quality
- No readable on-screen text, no watermarks, no English captions
Avoid: studio lighting, posed expression, perfect symmetry, smoothed skin, legible scoreboard text, posed smile
Por qué el modo razonamiento importa para la identidad facial
GPT Image 2 se lanzó el 21 de abril de 2026 como el primer modelo de imagen mainstream con razonamiento nativo — planea, busca en la web cuando es útil y verifica su propia salida antes de renderizar. Para este trend, eso hace una cosa que importa: mantiene la geometría facial entre regeneraciones. El modelo también reporta ~99% de precisión a nivel de caracteres en escrituras latinas, CJK, hindi y bengalí y soporta outputs de hasta 4K. El modo razonamiento honra las instrucciones negativas —"no skin smoothing", "no beauty filter"— de forma más fiable que la generación sin razonamiento, que es la palanca para evitar el sesgo de belleza señalado por la crítica de Elle India.
Ajustes del prompt que marcan la diferencia
No todas las líneas del prompt tienen el mismo peso. Estas son las que realmente cambian el output:
| Ajuste | Qué poner | Por qué importa |
|---|---|---|
| Compresión tele | "telephoto lens compression, shallow depth of field" | La clave visual de transmisión más importante; el encuadre angular destruye la autenticidad |
| Dirección de luz | "golden hour light raking from the upper-right" | La luz lateral parece estadio natural; la luz frontal plana parece estudio |
| Bebida en mano | "iced americano in a clear plastic cup with condensation" | La posición de la mano rompe el encuadre simétrico "posado" |
| Ropa | "pastel knit cardigan", "team cap or visor" | Textura y silueta específicas superan el vago "casual" |
| Encuadre | "head and shoulders, center-left of frame" | El sujeto descentrado imita cómo las cámaras de difusión encuentran caras |
| Expresión | "mid-action: blinking, slight surprise, soft involuntary smile" | La acción en curso supera siempre a la expresión terminada |
| Fans de fondo | "color-blocked pink, teal, and white team merchandise" | Los bloques de color parecen cultura fan coreana; la multitud genérica podría ser cualquier lugar |
| Superposición marcador | "faint ghosted scoreboard graphic in the upper-right corner" | Bloqueo visual de transmisión; NO debe ser legible |
Paso 2 — Anima el fotograma con Seedance 2
Abre Seedance 2 en LoveGen AI, cambia al modo imagen-a-video, sube el fotograma del Paso 1 como referencia primaria y añade hasta tres frames de referencia adicionales si los tienes (selfie de frente, ángulo de tres cuartos, expresión alternativa). Pega el prompt de animación.
El prompt de animación (copiar y pegar)
Animate the supplied KBO baseball broadcast still into a 5-second clip. Use the attached reference frames to lock the subject's facial identity across every video frame — no drift, no morphing.
Motion (subtle, broadcast-realistic):
- Subject blinks twice naturally within the clip
- Slight gaze shift toward the camera, then back to the field
- Small involuntary smile or eyebrow lift mid-clip
- One micro-movement of the drink-holding hand (no full sip)
- Background crowd: ambient micro-motion only — heads turning slowly, hands occasionally raising, no synchronized cheering
Camera (broadcast feel):
- Static shot with very slight handheld drift, no zoom, no pan
- Maintain the source still's telephoto compression and shallow depth of field
- Preserve the bokeh and the ghosted scoreboard graphic in the upper-right
Audio (native, single-pass, no overdub):
- Ambient KBO stadium background: distant crowd murmur, occasional clap, faint chant in Korean from the upper deck
- Soft synthesized broadcast organ riff barely audible underneath
- No commentary, no English announcer voice, no music bed
- Audio peaks fall on natural visual beats (subject blink, distant bat crack)
Output:
- 5 seconds, 16:9, 1080p or higher
- Single continuous shot, no cuts
- Match the source still's color grade exactly: cool teal-and-indigo midtones with warm complexion preservation
Uso de referencias multi-imagen para preservar la identidad en el movimiento
Seedance 2 soporta hasta cuatro imágenes de referencia para guiar una sola generación, que es la defensa más fiable contra la deriva de identidad entre frames de video. Combina el fotograma de GPT Image 2 con dos o tres ángulos diferentes de tu cara. El modelo resuelve la geometría del sujeto desde el consenso entre esos frames, por eso el resultado mantiene la identidad desde el frame 0 hasta el frame 150 en lugar de morphear en el punto medio.

Audio nativo — sincroniza el estadio en un solo pase
Seedance 2 genera audio sincronizado en el mismo pase que el video, lo que significa que los vítores del estadio, el murmullo ambiental y los efectos de sonido se alinean automáticamente con la acción en pantalla. Especifica las pistas de audio en el prompt — "ambient stadium murmur, occasional clap, faint chant in Korean" — y el modelo producirá la pista de audio de forma nativa en lugar de un video silencioso que necesite overdub. Mantén las descripciones de audio del prompt cortas y concretas — Seedance 2 sigue pistas de sonido específicas mejor que el vago "stadium sounds".
Paso 3 — Exporta y publica en TikTok, Reels y Shorts
El trend vive en feeds verticales, pero la estética de transmisión depende del encuadre horizontal. La jugada correcta es generar en 16:9 y luego recortar.
Relación de aspecto, duración y resolución por plataforma
- TikTok: 9:16 vertical, 1080×1920, de cinco a siete segundos. Recorta la fuente 16:9 con el sujeto centrado; deja que el bokeh se pierda por los bordes izquierdo y derecho.
- Instagram Reels: 9:16, mismas dimensiones, de cinco a diez segundos. Reels premia un gancho en el primer segundo — mantén el momento de acción del sujeto en el frame de apertura.
- YouTube Shorts: 9:16 hasta 60 segundos, aunque de cinco a ocho segundos es óptimo para este formato. Shorts penaliza los loops; termina el clip en un beat natural.
En cuanto a resolución, renderiza el fotograma de GPT Image 2 a la configuración más alta disponible (el modelo soporta hasta 4K), luego deja que Seedance 2 genere a 1080p. Reducir a la resolución de la plataforma preserva el detalle; escalar hacia arriba introduce artefactos.
Convenciones de texto que amplían el alcance del trend
Tres patrones de caption funcionan consistentemente en el trend:
- El caption del reveal — finge que el clip es real, deja que la IA sea el chiste en los comentarios. Ejemplo: "me pillaron en cámara en el partido de la KBO hoy 😭".
- El caption de divulgación — declara la IA desde el principio, usa el hashtag de marca del trend.
- El caption de participación — invita a los espectadores a probar el mismo flujo de trabajo.
Siempre usa divulgación de IA donde lo requieran las reglas de la plataforma y la legislación de tu jurisdicción.
Modos de fallo comunes y soluciones
| Síntoma | Causa probable | Solución |
|---|---|---|
| La cara cambia entre el frame 1 y el 5 | Referencia de video de imagen única | Añade tres frames de referencia más en Seedance 2; la referencia multi-imagen resuelve la deriva |
| Piel parece plástica o retocada | Sesgo de belleza por defecto | Añade "natural skin texture, visible pores, no skin smoothing, candid imperfection" al prompt |
| Texto del marcador coreano parece garabatos | El prompt pedía texto legible | Cambia a "faint ghosted scoreboard graphic, no readable text" |
| Mirada muerta fija a la cámara | Expresión posada en el prompt | Reemplaza por "mid-action: blinking, slight surprise, soft involuntary smile" |
| El audio no coincide con la acción | Prompt de audio vago | Especifica pistas concretas ("distant clap, faint chant in Korean") |
| El recorte vertical corta la cara | Generado nativamente en 9:16 | Genera en 16:9, recorta en editor con sujeto centrado |
| Los fans de fondo parecen congelados | El prompt suprimió todo el movimiento | Permite "ambient micro-motion — heads turning slowly, hands occasionally raising" |
| El sujeto lleva el jersey equivocado | Prompt demasiado específico en equipo | Elimina referencias a equipos concretos; especifica solo "team cap" y paleta de colores |
Combinaciones alternativas si no puedes usar GPT Image 2 + Seedance 2
Si GPT Image 2 o Seedance 2 no está disponible en tu plan, dos alternativas se acercan más a la misma calidad:
- Combina GPT Image 2 con Kling 3 — conserva el fotograma fuerte pero pierde el audio nativo. Tendrás que sobredublar ambientación de estadio en CapCut o un editor similar.
- Explora todos los modelos de video actuales en el hub de modelos de video de LoveGen AI — Sora 2, Veo 4 y Wan 2.2 soportan imagen-a-video, aunque solo Seedance 2 incluye audio nativo.
Evita las herramientas de plantilla genéricas para publicaciones serias en este trend. Bloquean los valores predeterminados de filtro de belleza, limitan la resolución y no ofrecen control sobre las claves de transmisión específicas que separan un clip creíble de uno obvio.
¿Es ético y legal el trend de béisbol AI coreano?
El trend tiene una participación muy amplia, pero dos cosas merecen reflexión antes de publicar. Primero, la crítica de Elle India señaló cómo el comportamiento de filtro de belleza por defecto de las herramientas de plantilla impone estándares poco realistas. El lenguaje del prompt en esta guía ("natural skin texture, visible pores, no skin smoothing, candid imperfection") es el contrapunto directo, y el modo razonamiento honra esas restricciones de forma más consistente.
Segundo, nunca generes la imagen de otra persona sin su consentimiento — el trend es un medio de autorretrato, no una forma de poner a un amigo, un ex o una figura pública en metraje fabricado. Divulga la generación por IA al publicar. Trata el formato como juego creativo con tu propia imagen, y la exposición legal se mantiene mínima.
Preguntas frecuentes
P: ¿Qué es el trend de béisbol AI coreano? R: El trend de béisbol AI coreano es un formato viral donde los usuarios transforman una selfie en un clip de 5 segundos que parece una cámara de TV en vivo de la KBO captándolos en las gradas del estadio. La estética imita las transmisiones de SPOTV o SBS Sports — compresión de teleobjetivo, bokeh de difusión, expresiones espontáneas. El formato estalló en TikTok, Instagram Reels y YouTube Shorts durante la primavera de 2026.
P: ¿Cómo empezó el trend de béisbol AI coreano? R: El trend se remonta a un clip de 5 segundos publicado en X a principios de 2026 mostrando a una joven viendo béisbol coreano. La publicación acumuló más de 15 millones de views antes de que los espectadores se dieran cuenta de que era completamente generada por IA. El reveal — que un plano hiperrealista de "fan en las gradas" podía fabricarse a partir de una sola imagen — convirtió el formato en un trend viral participativo en cuestión de días.
P: ¿Cuál es el mejor prompt de IA para el look de transmisión de béisbol coreano? R: La estructura de prompt más fuerte comienza con "ultra-realistic, cinematic, candid, KBO baseball broadcast screenshot," nombra al sujeto, fija la identidad facial ("preserve exact facial geometry, no beauty filter"), especifica ropa y un accesorio (normalmente una bebida fría), y bloquea el encuadre ("16:9, telephoto compression, bokeh, broadcast color grading"). El prompt completo de copiar y pegar para GPT Image 2 está en el Paso 1 de esta guía.
P: ¿Cómo mantengo mi cara igual en múltiples generaciones de IA? R: Usa el modo razonamiento de GPT Image 2 para el fotograma estático — planea y comprueba la geometría facial antes de dibujar, manteniendo la identidad entre regeneraciones de forma más fiable. Para el paso de video, dale a Seedance 2 hasta cuatro imágenes de referencia de tu cara desde diferentes ángulos. La deriva de identidad es el fallo más común del trend; la referencia multi-imagen es la corrección más importante.
P: ¿Puedo añadir audio de estadio sin sobredublar en CapCut? R: Sí — Seedance 2 genera audio sincronizado en el mismo pase que el video, por lo que los vítores, el murmullo y los efectos de sonido se alinean automáticamente con la acción en pantalla. Especifica las pistas de audio en el prompt ("ambient stadium murmur, distant chant"). Los flujos de trabajo antiguos que combinan GPT Image 2 con Kling 3 requieren sobredub manual en un editor separado.
P: ¿Cuánto puede durar un video del trend en Seedance 2? R: Seedance 2.0 genera videos de hasta 15 segundos en un solo pase. Para el trend, cinco segundos es el punto óptimo — coincide con el ritmo del clip viral original y encaja en la duración más reproducida de TikTok. Los outputs más largos son útiles para variantes de "corte de transmisión" que muestran la cámara volviendo al campo.
P: ¿Qué relación de aspecto debo usar para TikTok o Instagram Reels? R: Genera en 16:9 (la relación nativa de transmisión) para máximo realismo, luego recorta a 9:16 en tu editor con el sujeto centrado. Generar directamente en 9:16 sacrifica la sensación de transmisión porque la TV KBO real se graba en 16:9. El flujo de trabajo 16:9-y-luego-recortar mantiene la compresión de teleobjetivo y el bokeh intactos mientras cabe en feeds verticales.
P: ¿Por qué mi cara generada por IA parece suave o poco realista? R: El sesgo de belleza por defecto en muchos modelos de imagen suaviza la piel y estandariza rasgos — exactamente lo que Elle India señaló como imposición de "estándares de belleza irreales". Contrarresta añadiendo "natural skin texture, visible pores, no skin smoothing, candid imperfection, photojournalism style" al prompt de GPT Image 2. El modo razonamiento honra estas restricciones negativas más consistentemente.
P: ¿Cuánto cuesta hacer un video del trend en LoveGen AI? R: Un flujo de trabajo típico es una generación de GPT Image 2 (a menudo con dos o tres regeneraciones hasta que el fotograma se bloquea) más un pase de imagen-a-video en Seedance 2. El precio exacto depende de tu nivel de plan; consulta la página de precios para las tarifas actuales por generación.
P: ¿Es ético publicar videos de fans KBO generados por IA? R: El trend tiene participación amplia, pero dos preocupaciones merecen atención. Primero, el comportamiento de filtro de belleza por defecto de las herramientas de plantilla empuja estándares poco realistas — contrarresta con las pistas de textura e imperfección de esta guía. Segundo, nunca generes la imagen de otra persona sin consentimiento, y divulga la generación por IA al publicar.
P: ¿Puedo usar el trend con deportes distintos al béisbol KBO? R: La receta visual se transfiere a cualquier deporte con un look de transmisión reconocible — fútbol J.League en Japón, béisbol NPB, fútbol K League, baloncesto NBA. Cambia "KBO baseball" por la liga objetivo, nombra al broadcaster real (NHK, ESPN, TNT), y ajusta la ropa y la paleta de colores de la multitud para que coincida con la cultura fan real. El flujo de trabajo de dos modelos — GPT Image 2 para el fotograma, Seedance 2 para el movimiento y el audio — se mantiene igual.
