¡Seedance 2.0 se ha lanzado oficialmente!
Desde los días en que solo podíamos contar historias con texto y fotogramas inicial/final, hemos soñado con construir un modelo de video que realmente comprenda su expresión. ¡Hoy, finalmente está aquí!
Seedance 2.0 ahora admite cuatro modalidades de entrada: imagen, video, audio y texto, ofreciendo una expresión más rica y una generación más controlable.
Puede establecer el estilo visual con una sola imagen, especificar movimientos de personajes y cambios de cámara con un video, y establecer el ritmo y la atmósfera con unos segundos de audio... Combinado con indicaciones, el proceso de creación se vuelve más natural, eficiente y verdaderamente como ser un "director".
Reproducción Precisa de Referencia de Imagen
Reproducción precisa de composición, detalles de personajes
Replicación de Video de Referencia
Admite replicación del lenguaje de cámara, ritmos de acción complejos y efectos creativos
Extensión y Continuidad Fluida
Genere tomas continuas a partir de indicaciones — no solo generar, sino "seguir filmando"
Edición Mejorada
Admite reemplazo, eliminación y adición de personajes en videos existentes
La creación de video nunca ha sido solo "generación" — se trata de controlar la expresión. 2.0 no es solo multimodal, es una forma verdaderamente controlable de crear.
Seedance 2.0, la creación multimodal comienza aquí. Atrévase a imaginar — deje el resto en sus manos.
1. Resumen de Parámetros
| Dimensión Principal | Seedance 2.0 |
|---|---|
| Entrada de Imagen | Hasta 9 imágenes |
| Entrada de Video | Hasta 3 videos, duración total no superior a 15s (los videos de referencia cuestan un poco más) |
| Entrada de Audio | Admite carga de MP3, hasta 3 archivos, duración total no superior a 15s |
| Entrada de Texto | Lenguaje natural |
| Duración de Generación | Hasta 15s, elección libre entre 4-15s |
| Salida de Audio | Efectos de sonido/música de fondo integrados |
<strong>Límite de Interacción:</strong> El máximo actual para entradas mixtas es de <strong>12 archivos</strong>. Recomendamos priorizar los materiales que tienen mayor impacto en los elementos visuales o el ritmo, y distribuir sabiamente la cantidad de archivos entre las modalidades.
2. Métodos de Interacción
Nota: Seedance 2.0 admite puntos de entrada "Primer/Último Fotograma" y "Referencia Universal". La referencia inteligente de múltiples fotogramas y sujetos no es seleccionable. Si solo sube una imagen de primer fotograma + indicación, use la entrada de Primer/Último Fotograma; para entrada combinada multimodal (imagen, video, audio, texto), entre a través de la entrada de Referencia Universal.
El método de interacción actual utiliza <code>@nombre_material</code> para especificar el propósito de cada imagen, video y audio, por ejemplo:
- @Imagen1 como primer fotograma
- @Video1 referencia lenguaje de cámara
- @Audio1 para música de fondo
Interfaz Principal

Entrada: Seedance 2.0 - Referencia Universal / Primer-Último Fotograma

Abrir diálogo de archivo local

Seleccionar archivos, agregar al cuadro de entrada
Modo de Referencia Universal — Método 1: Escribir "@" para invocar referencia

Escribir "@"

Seleccionar referencia, se inserta en el cuadro de entrada

Ingresar indicación
Modo de Referencia Universal — Método 2: Hacer clic en la herramienta "@" para invocar referencia

Hacer clic en "@"

Seleccionar referencia, se inserta en el cuadro de entrada

Ingresar indicación
Después de cargar materiales, las imágenes, videos y audios admiten vista previa al pasar el cursor:



A continuación se presentan algunos ejemplos de uso y enfoques creativos para diferentes escenarios que le ayudarán a comprender mejor las mejoras de Seedance 2.0 en calidad de generación, capacidad de control y expresión creativa. Si no sabe por dónde empezar, ¡consulte estos ejemplos para inspirarse!
Vista Previa de Capacidades / Mejoras de Seedance 2.0
1. Capacidades Básicas Significativamente Mejoradas: ¡Más Estable, Más Fluido, Más Realista!
Más allá de lo multimodal, Seedance 2.0 está significativamente mejorado a nivel fundamental — <strong>física más realista</strong>, <strong>movimiento más natural y fluido</strong>, <strong>comprensión de instrucciones más precisa</strong>, <strong>consistencia de estilo más estable</strong>. Puede manejar de manera confiable acciones complejas, movimiento continuo y otras tareas de generación difíciles, haciendo que la salida de video general sea más realista y fluida — ¡una evolución integral de las capacidades fundamentales!
Una chica colgando ropa elegantemente para secar, al terminar recoge otra pieza del balde y la sacude vigorosamente.
Primer fotogramaEl personaje en la pintura tiene una expresión culpable, los ojos mirando de izquierda a derecha espiando fuera del marco, rápidamente extiende la mano para agarrar una cola y da un sorbo, mostrando una expresión satisfecha. Luego se escuchan pasos, el personaje apresuradamente devuelve la cola. Un vaquero recoge la cola y se aleja. Finalmente la cámara avanza mientras la pantalla se desvanece a negro con solo una lata de cola iluminada desde arriba, con subtítulos artísticos en la parte inferior: "¡YiKou Cola, hay que probarla!"
Primer fotogramaLa cámara retrocede ligeramente (revelando la vista completa de la calle) y sigue a la heroína mientras camina. El viento sopla el dobladillo de su falda mientras camina por una calle londinense del siglo XIX. Un automóvil a vapor pasa rápidamente por el lado derecho, su viento levanta su falda mientras ella frenéticamente la presiona con ambas manos en estado de shock. Los sonidos de fondo incluyen pasos, ruido de multitud y sonidos de vehículos.
Primer fotogramaLa cámara sigue a un hombre de negro huyendo rápidamente con una multitud persiguiéndolo. La cámara cambia a una toma de seguimiento lateral mientras el personaje asustado derriba un puesto de frutas, se levanta y continúa corriendo, con sonidos de la multitud caótica.
Primer fotograma2. Actualización multimodal integral: ¡La creación de video entra en la era de la "combinación libre"!
2.1 Introducción Multimodal
Admite la carga de texto, imágenes, videos y audio — todos pueden usarse como material fuente o de referencia. Puede hacer referencia a las acciones, efectos, estilo, movimiento de cámara, personajes, escenas y sonidos de cualquier contenido. Siempre que su indicación sea clara, el modelo puede comprenderla.
Seedance 2.0 = Referencia Multimodal (referenciar cualquier cosa) + Fuerte Generación Creativa + Respuesta Precisa a Instrucciones (excelente comprensión)
Simplemente describa en lenguaje natural los elementos visuales y las acciones que desea, y aclare si es una referencia o una edición. Al usar múltiples materiales, verifique que cada @referencia esté claramente etiquetada — ¡no mezcle imágenes, videos y personajes!
2.2 Métodos de Uso Especiales (Sin Límites, Solo Sugerencias)
¿Tiene imágenes de primer/último fotograma? ¿También quiere referenciar acciones de video?
Escríbalo claramente en la indicación, por ejemplo: "@Imagen1 como primer fotograma, referencia las acciones de lucha de @Video1"
¿Quiere extender un video existente?
Especifique la duración de la extensión, por ejemplo "Extender @Video1 por 5s". Nota: La duración de generación seleccionada debe ser la duración de la "nueva porción" (por ejemplo, extender 5s, también seleccione 5s de duración de generación)
¿Quiere fusionar múltiples videos?
Explique la lógica de composición en la indicación, por ejemplo: "Quiero agregar una escena entre @Video1 y @Video2, el contenido es xxx"
¿No tiene materiales de audio?
Puede referenciar directamente el audio de un video
¿Quiere generar acciones continuas?
Agregue descripciones de continuidad en la indicación, por ejemplo: "El personaje transiciona directamente de saltar a rodar, manteniendo un movimiento fluido y coherente" @Imagen1@Imagen2@Imagen3...
2.3 ¡Esos Desafíos de Video de Larga Data Ahora Realmente Pueden Resolverse!
La creación de video siempre tiene sus puntos problemáticos: los rostros cambian entre tomas, las acciones no coinciden, las extensiones de video no son naturales, el ritmo se desajusta durante las ediciones... Esta actualización multimodal aborda todos estos "dolores de cabeza persistentes" de una vez. A continuación se presentan casos de uso específicos.
2.3.1 Mejora Integral de la Consistencia
Puede que haya experimentado estas frustraciones: los personajes se ven diferentes de una toma a otra, los detalles del producto se pierden, el texto pequeño se vuelve borroso, los saltos de escena, los estilos de cámara inconsistentes... Estos problemas comunes de consistencia en la creación ahora pueden resolverse en 2.0. Desde los rostros hasta la ropa y los detalles de fuentes, la consistencia general es más estable y precisa.
El hombre @Imagen1 camina cansado por el pasillo después del trabajo, su paso se ralentiza, finalmente se detiene en la puerta principal. Primer plano del rostro, el hombre respira profundamente, ajusta sus emociones, guarda la negatividad, se relaja. Luego primer plano de encontrar las llaves, insertar en la cerradura. Después de entrar en casa, su pequeña hija y un perro mascota corren alegremente a recibirlo y abrazarlo. El interior es muy cálido y acogedor, con diálogo natural durante todo el video.
Referencia de personajeReemplazar a la chica en @Video1 con una actriz de Ópera China (Hua Dan), en un escenario exquisito. Referenciar los movimientos de cámara y efectos de transición de @Video1, usando ángulos de cámara que coincidan con las acciones del personaje, logrando la estética escénica definitiva y un impacto visual mejorado.
Usando la apariencia del personaje de la imagen de referencia, generar un avance para un drama de viaje en el tiempo de época. 0-3 segundos: El protagonista masculino con la apariencia de la imagen de referencia 1 sostiene una pelota de baloncesto, mirando hacia arriba a la cámara. Diciendo "Solo quería tomar algo, ¿realmente estoy a punto de viajar en el tiempo?..."...
Referencia de personajeReferenciar todas las transiciones y movimientos de cámara de @Video1, un plano secuencia continuo. Comenzando con un tablero de ajedrez, la cámara se desplaza a la izquierda para revelar arena amarilla en el suelo, la cámara sube hacia una playa...
0-2 segundos: Cortes rápidos de cuatro paneles, corbatas de moño rojas, rosas, moradas y de estampado de leopardo mostradas en secuencia, primer plano del brillo del satén y texto de la marca "chéri"... (anuncio con voz en coreano)
Imagen del productoCrear una presentación de estilo comercial del bolso en @Imagen2, con la vista lateral referenciando @Imagen1, la textura de la superficie referenciando @Imagen3. Todos los detalles del bolso deben mostrarse, con música de fondo grandiosa y majestuosa.
Referencia lateral
Cuerpo principal del bolso
Referencia de texturaUsar @Imagen1 como primer fotograma, perspectiva en primera persona, referenciar los efectos de cámara de @Video1. La escena superior referencia @Imagen2, la escena izquierda referencia @Imagen3, la escena derecha referencia @Imagen4.
Primer fotograma
Escena superior
Escena izquierda
Escena derecha2.3.2 Replicación Precisa de Movimientos de Cámara y Acciones Avanzados / Controlables
Anteriormente, para hacer que un modelo imitara el bloqueo de escenas de películas, el trabajo de cámara o acciones complejas, tenía que escribir toneladas de indicaciones detalladas o simplemente no podía hacerlo. Ahora, simplemente suba un video de referencia y listo.
Referenciar el personaje masculino de @Imagen1, está en el ascensor de @Imagen2. Referenciar completamente los efectos de cámara de @Video1 y las expresiones faciales del protagonista. Zoom Hitchcock durante el pánico, luego varias tomas orbitales mostrando el interior del ascensor...
Personaje
Escena del ascensor
Referencia de escenaReferenciar el personaje masculino de @Imagen1, está en el pasillo de @Imagen2. Referenciar completamente los efectos de cámara de @Video1 y las expresiones faciales del protagonista. La cámara sigue al protagonista corriendo por las esquinas en @Imagen2...
Personaje
Pasillo
Pasillo largo
Bifurcación
EscenaLa tableta de @Imagen1 como sujeto principal, cámara referenciando @Video1, empujando hacia un primer plano de pantalla, la cámara rota mientras la tableta gira para mostrar su apariencia completa. Los flujos de datos en la pantalla siguen cambiando, los alrededores se transforman gradualmente en un espacio de datos de ciencia ficción.
TabletaLa actriz de @Imagen1 como sujeto principal, referenciar las técnicas de cámara de @Video1 para movimientos rítmicos de empujar-tirar-panorámica. Los movimientos de la actriz también referencian los pasos de baile de la mujer en @Video1, actuando enérgicamente en el escenario.
ActrizReferenciar los personajes con lanza de @Imagen1@Imagen2, el personaje de doble espada de @Imagen3@Imagen4, imitar las acciones de @Video1, luchando en el bosque de arces de @Imagen5.
Personaje con lanza 1
Personaje con lanza 2
Personaje de doble espada 1
Personaje de doble espada 2
Bosque de arcesReferenciar las acciones del personaje del Video1, referenciar el lenguaje de cámara orbital del Video2. Generar una escena de lucha entre el Personaje 1 y el Personaje 2. La lucha se desarrolla bajo un cielo estrellado, con polvo blanco elevándose durante la batalla. La escena de lucha es espectacular y la atmósfera es muy tensa.
Personaje 1
Personaje 2Referenciar el trabajo de cámara y el ritmo de transición de tomas del Video1, replicar usando el superdeportivo rojo de la Imagen1.
Superdeportivo rojo2.3.3 Plantillas Creativas / Replicación Precisa de Efectos Complejos
Más que solo generar imágenes y escribir historias, Seedance 2.0 también admite "copiar desde referencia" — transiciones creativas, anuncios terminados, clips de películas, ediciones complejas. Siempre que tenga imágenes o videos de referencia, el modelo puede identificar ritmos de acción, lenguaje de cámara, estructura visual y replicarlos con precisión. No se preocupe si no conoce la terminología profesional — simplemente describa lo que desea referenciar y el modelo generará una versión de alta calidad para usted. ¡Sea audaz! Realmente puede hacerlo.
Reemplazar el personaje en @Video1 con @Imagen1, @Imagen1 como primer fotograma. El personaje se pone gafas virtuales de ciencia ficción, referenciar el trabajo de cámara de @Video1, tomas orbitales cercanas, transicionando de tercera persona a la perspectiva subjetiva del personaje, viajando a través de las gafas virtuales de IA...




Referenciar las características faciales de la modelo de la primera imagen. La modelo viste los atuendos de las imágenes de referencia 2-6 y se acerca a la cámara, adoptando poses juguetonas, geniales, lindas, sorprendidas y elegantes...
Modelo
Atuendo 1
Atuendo 2
Atuendo 3
Atuendo 4
Atuendo 5Referenciar el concepto publicitario del video, usar las imágenes de chaqueta de plumas proporcionadas, con el siguiente texto publicitario: "Esto es plumón de ganso, este es el cisne cálido, esta es la chaqueta de plumón de cisne polar vestible. Mantente cálido para el año nuevo, vive cálido." Generar un nuevo video publicitario de chaqueta de plumas.
Chaqueta de plumas
Plumón de ganso
CisneEstilo de tinta en blanco y negro, el personaje de @Imagen1 referencia los efectos y acciones de @Video1, realizando un segmento de kung fu de Tai Chi estilo tinta china.
PersonajeReemplazar el personaje inicial de @Video1 con @Imagen1, referenciar completamente los efectos y acciones del Video1. Pétalos de rosa crecen desde el estambre de la flor en la mano, las grietas se extienden hacia arriba en el rostro...
Personaje 1
Personaje 2Comenzando desde el techo de @Imagen1, referenciar el efecto de rompecabezas-fragmentación de @Video1 para la transición. Reemplazar el texto "BELIEVE" con "Seedance", referenciar la fuente de @Imagen2.
Techo
Referencia de fuenteApertura con pantalla negra, referenciar los efectos de partículas y textura del Video1. Arena dorada a la hoja de oro se desplaza desde el lado izquierdo del encuadre y cubre hacia la derecha, referenciar el efecto de dispersión de partículas de @Video1. El texto de @Imagen1 aparece gradualmente en el centro del encuadre.
TextoEl personaje de @Imagen1 referencia las acciones y cambios de expresión de @Video1, mostrando el comportamiento abstracto de comer fideos instantáneos.
Personaje2.3.4 Creatividad del Modelo y Desarrollo de Guión
Animar @Imagen1 en orden de izquierda a derecha, de arriba a abajo como una actuación de cómic, manteniendo los diálogos de los personajes consistentes con la imagen. Agregar efectos de sonido especiales para las transiciones de panel y los momentos clave de la trama. El estilo general debe ser humorístico e ingenioso; el estilo de actuación referencia @Video1.
Imagen de cómicReferenciar el guión gráfico de estilo documental de @Imagen1, referenciando las divisiones de toma, encuadre, movimientos de cámara, visuales y texto de @Imagen1. Crear una apertura de estilo reconfortante de 15s sobre "Las Cuatro Estaciones de la Infancia".
Guión gráficoReferenciar el audio del Video1, usando las Imágenes 1-5 como inspiración, crear un video impulsado por la emoción. La música de fondo referencia @Video1.





2.3.5 Extensión de Video
Extender video 15s, referenciar @Imagen1, personaje de burro-montando-motocicleta de @Imagen2. Agregar un segmento publicitario creativo: Escena 1: Cámara lateral fija, el burro sale del granero en motocicleta... Escena 3: ...eslogan publicitario "Inspirar Creatividad, Enriquecer la Vida"
Apariencia del burro 1
Apariencia del burro 2Extender video por 6s, la música de guitarra eléctrica comienza, el texto publicitario "JUST DO IT" aparece en el centro de la pantalla y luego se desvanece gradualmente, la cámara sube hacia el techo...
Ropa deportiva
LogoExtender @Video1 por 15 segundos. 1-5s: La luz y la sombra se deslizan lentamente a través de las persianas sobre la mesa de madera y la taza... 11-15s: El texto aparece gradualmente: "Lucky Coffee", "Desayuno", "AM 7:00-10:00".
Extender hacia adelante por 10s. Con la cálida luz de la tarde, la cámara comienza desde una fila de toldos ondeando con la brisa en la esquina de la calle, desplazándose lentamente hacia abajo hasta unas pequeñas margaritas asomándose en la base de la pared...
2.3.6 Audio Más Preciso, Sonido Más Realista
Cámara fija, lente ojo de pez central mirando hacia abajo a través de una abertura circular. Referenciar el lente ojo de pez del Video1, hacer que el caballo de @Video2 mire al lente ojo de pez, referenciar las acciones de habla de @Video1, el BGM de fondo referencia el audio de @Video3.
Basándose en las fotos promocionales del edificio de oficinas proporcionadas, generar un documental inmobiliario de 15 segundos en estilo cinematográfico realista en formato panorámico 2.35:1, 24fps. El tono de voz del narrador referencia @Video1...



Un diálogo de asado en una "Sala de Asado de Gato y Perro", con emociones ricas propias de una actuación de stand-up: Meow-chan (presentador gato): "¿Quién entiende esto, familia?...", Wangzai (presentador perro): "¿Tienes el descaro de hablar de mí?..."
Referencia de escenaComienza la música de apertura del segmento clásico de Ópera Yu "El Caso de Chen Shimei". El Juez Bao de túnica negra a la izquierda señala al Chen Shimei de túnica roja a la derecha, cantando Ópera Yu con los dientes apretados...
Referencia de escenaGenerar un video musical de 15 segundos. Palabras clave: composición estable / empuje-tirón suave / ángulo bajo heroico / documental pero premium... Rayos volumétricos de contraluz lateral al atardecer a través de partículas de polvo, composición cinematográfica, grano de película real, brisa suave moviendo los bordes del abrigo.
Referencia de escenaLa chica del centro con sombrero canta suavemente "¡Estoy tan orgullosa de mi familia!"... La música latina comienza de fondo... Toda la familia forma un círculo, bailando con música animada, las faldas girando.
Referencia de escenaCámara fija. El hombre musculoso de pie (capitán) aprieta el puño y dice en español: "¡Asalto en tres minutos!"... Todos se ponen firmes, completando señales tácticas con las manos entre el sonido del equipo chocando.
Referencia de escena0-3s: Suena la alarma del despertador de apertura... 3-10s: Toma panorámica rápida, cortando al lado opuesto con un primer plano del rostro del hombre. El hombre despierta a regañadientes a la chica, el tono de voz y el timbre referencian @Video1... 12-15s: Corte al cuerpo completo del protagonista masculino, suspira: "¡Realmente no puedo hacer nada contigo!"
Chica
HombreEl mono de @Imagen1 camina hacia el mostrador de la tienda de bubble tea... El mono ordena al servidor con acento de Sichuan: "Oye hermana, ¿tienen 'Adiós mi Concubina'?"
Mono
Servidor bichón
Tienda de bubble teaEn estilo y voz de divulgación científica, narrar el contenido de la Imagen 1, que incluye la historia de Sun Wukong pidiendo prestado el Abanico de Banana a la Princesa Abanico de Hierro para cruzar las Montañas Llameantes...
Ilustración de Viaje al Oeste2.3.7 Mayor Continuidad de Toma (Plano Secuencia)
@Imagen1@Imagen2@Imagen3@Imagen4@Imagen5, plano secuencia de seguimiento, siguiendo a un corredor desde la calle subiendo escaleras, a través de un pasillo, hasta un tejado, y finalmente contemplando la ciudad.





Comenzando con @Imagen1 como primer fotograma, la vista se aleja hacia una ventana de avión. Las nubes se deslizan lentamente al encuadre, una de ellas adornada con caramelos coloridos... transformándose gradualmente en el helado de @Imagen2...
Ventana
Helado
PersonajeEstilo de thriller de espionaje, @Imagen1 como fotograma de apertura. La cámara sigue a una agente femenina con abrigo rojo caminando hacia adelante... Sin cortes en todo el video, un plano secuencia continuo.
Primer fotograma
Edificio de esquina
Chica enmascarada
MansiónDesde la toma exterior de @Imagen1, perspectiva en primera persona empuje rápido hacia el interior de la cabaña en primer plano. Un pequeño ciervo @Imagen2 y una oveja @Imagen3 están tomando té y conversando junto a la chimenea. La cámara empuja para un primer plano de la taza de té, el estilo referencia @Imagen4.
Exterior
Ciervo
Oveja
Taza de té@Imagen1@Imagen2@Imagen3@Imagen4@Imagen5, plano secuencia emocionante de montaña rusa en primera persona, con la montaña rusa yendo cada vez más rápido.





2.3.8 Edición de Video Altamente Utilizable
A veces ya tiene un video y no quiere encontrar nuevas imágenes ni rehacer todo desde cero — solo quiere ajustar un pequeño segmento de acción, extender unos segundos o hacer que la actuación de un personaje sea más cercana a su visión. Ahora puede usar video existente como entrada y hacer modificaciones específicas a segmentos, acciones o ritmos específicos sin cambiar nada más.
Subvertir la trama de @Video1. Los ojos del hombre cambian instantáneamente de tiernos a fríos y despiadados. En un momento en que la heroína está completamente desprevenida, la empuja con fuerza del puente...
Subvertir toda la trama de @Video1. 0-3s: Hombre de traje sentado en un bar... 6-9s: De repente el hombre trajeado saca de debajo de la mesa — un paquete de bocadillos absurdamente grande...
Reemplazar a la cantante principal femenina en el Video1 con el cantante principal masculino de la Imagen1. Las acciones imitan completamente el video original, sin cortes, música de actuación de banda.
Cantante principal masculinoCambiar el peinado de la mujer en el Video1 a cabello largo rojo. El gran tiburón blanco de la Imagen1 emerge lentamente a la superficie, detrás de ella.
Gran tiburón blancoLa cámara del Video1 se desplaza a la derecha, el dueño de la tienda de pollo frito entrega apresuradamente pollo frito a los clientes en la fila... Primer plano del dueño sosteniendo una bolsa de papel impresa con el logo de la Imagen1...
Logo de la bolsa de papel2.3.9 Sincronización con Ritmo Musical
La chica en el póster sigue cambiando de atuendo, el estilo de ropa referencia @Imagen1@Imagen2, sosteniendo el bolso de @Imagen3, el ritmo del video referencia @Video.




Las imágenes @Imagen1-7 se sincronizan con las posiciones de fotogramas clave de @Video y el ritmo general para la coincidencia de ritmo. Los personajes en los fotogramas son más dinámicos...






Escenas de paisaje de @Imagen1-6, referenciar el ritmo visual de @Video, las transiciones coinciden con el estilo de escena y el ritmo musical para sincronización.






2.3.10 Mejor Interpretación Emocional
La mujer de @Imagen1 camina hacia el espejo, se mira a sí misma. La pose referencia @Imagen2. Después de un momento de contemplación, de repente comienza a gritar en un colapso emocional. El gesto de agarrar y las emociones y expresiones de gritos de colapso referencian completamente @Video1.
Mujer
Referencia de poseEste es un anuncio de campana extractora. @Imagen1 como fotograma de apertura, mujer cocinando elegantemente sin humo. La cámara se desplaza rápidamente a la derecha hacia @Imagen2 hombre sudando profusamente, cara roja, cocinando...
Mujer cocinando
Hombre cocinando
Campana extractora@Imagen1 como primer fotograma, la cámara rota y empuja más cerca. El personaje de repente mira hacia arriba, la apariencia facial referencia @Imagen2. Comienza a rugir fuertemente, emocionado con algo de estilo cómico, referenciando la expresión de @Imagen3. Luego el personaje se transforma en un oso, referenciando @Imagen4.
Primer fotograma
Referencia facial
Referencia de expresión
Referencia de osoUna Última Palabra
Las capacidades multimodales de Seedance 2.0 están en constante evolución. Continuaremos actualizando funciones y admitiendo más combinaciones de entrada. ¡Esperamos que este manual de usuario le ayude a dar rienda suelta a su creatividad con mayor libertad!
Si encuentra errores, tiene sugerencias de uso o necesita escenarios específicos, ¡no dude en dejarnos un mensaje o enviarnos un DM! Seguiremos optimizando para hacer de Jimeng una herramienta de productividad verdaderamente agradable y conveniente para usted.
Preguntas Frecuentes (FAQ)
¿Qué modalidades de entrada admite Seedance 2.0?
Seedance 2.0 admite cuatro modalidades de entrada: imágenes (hasta 9), videos (hasta 3, duración total ≤15s), audio (MP3, hasta 3, duración total ≤15s) y texto (lenguaje natural). El límite combinado de entrada es de 12 archivos.
¿Cuánto tiempo de video puede generar Seedance 2.0?
Puede generar videos de hasta 15 segundos, con selección libre entre 4-15 segundos. También admite extensión de video, permitiéndole continuar generando a partir de un video existente.
¿Cómo utilizo la función de referencia multimodal?
En el modo de Referencia Universal, use "@nombre_material" para especificar el propósito de cada imagen, video y audio. Por ejemplo: @Imagen1 como primer fotograma, @Video1 para referencia de cámara, @Audio1 para música de fondo. Puede escribir "@" directamente en el cuadro de entrada o hacer clic en el botón "@" en la barra de herramientas.
¿Cuáles son las mejoras principales de capacidad de Seedance 2.0?
Las capacidades principales incluyen: referencia multimodal (referenciar cualquier cosa), replicación precisa de cámara y acciones, replicación de efectos creativos, extensión y continuidad de video, edición de video (reemplazo/eliminación/adición de personajes), sincronización con ritmo musical, continuidad de plano secuencia, interpretación emocional y generación de voz. La física es más realista, el movimiento es más natural y fluido, la comprensión de instrucciones es más precisa y la consistencia de estilo es más estable.
¿Cómo extiendo un video existente?
Después de cargar un video, especifique la duración de la extensión en la indicación, por ejemplo "Extender @Video1 por 5s". Nota: La duración de generación debe establecerse en la duración de la "nueva porción" — por ejemplo, si extiende por 5s, también seleccione 5s de duración de generación. Se admite extensión tanto hacia adelante como hacia atrás.
¿Cuál es la diferencia entre Primer/Último Fotograma y Referencia Universal?
Si solo sube una imagen de primer fotograma + indicación, puede usar la entrada de Primer/Último Fotograma para un flujo de trabajo más simple. Para entrada combinada multimodal (imagen, video, audio, texto), necesita usar la entrada de Referencia Universal. El modo de Referencia Universal es más potente y admite necesidades creativas más complejas.