NUEVONuevo lanzamiento: Gemini Omni Agent ya está disponible — chatea para generar vídeos sin necesidad de parámetros técnicosProbar Agent
LogoGemini Omni
  • Gemini Omni Agent
  • Crear
  • Imagen con IA
  • Vídeo AI
  • Precios
Logo
Ahora es completamente accesible para todos los miembros de la comunidad públicaMay 2025

Generador de imágenes IA Z-Image

Z-Image es un modelo base de imágenes 6B de código abierto de Tongyi-MAI, diseñado para el cumplimiento de prompt, un amplio rango visual y variantes derivadas como Turbo y Edit. Úselo aquí para tareas text-to-image y sencillas de single-reference image-to-image.

Cargando...

Prompt:

1:1

4:3

3:4

16:9

9:16

Modelo:

Cargando...

Ejemplos de la escena 1
Cómo usar Z-Image

Genere con Z-Image aquí para obtener resultados rápidos de text-to-image y single-reference image-to-image

Empiece por un prompt, agregue una sola imagen de referencia si es necesario y refina los resultados en unos pocos pasos rápidos manteniendo las solicitudes enfocadas y claras.

01

Describa el sujeto y el objetivo visual

Redacte un prompt que incluya su sujeto, la perspectiva de cámara, la iluminación, la composición y cualquier texto necesario en la imagen.

02

Agregue una imagen de referencia si es necesario

Para bloquear el estado de ánimo, la forma del producto o la dirección del diseño, cargue una imagen de referencia y guíe el resultado con lenguaje natural claro.

03

Genere variantes rápidas y refina los resultados

Genere imágenes en la relación de aspecto que desee, compare los resultados y refina su prompt hasta que la composición y el texto coincidan con su visión.

Puntos fuertes centrales de Z-Image

Puntos fuertes clave de Z-Image como modelo de imagen fundamental

Z-Image es un modelo fundamental 6B abierto con alineación fiable por prompt, múltiples variantes de la familia y opciones de implementación local viables.

Modelo fundamental 6B de código abierto

Como modelo base central de la familia, Z-Image permite a los equipos estudiar, ajustar y desplegar la versión de rama ascendente sin depender de herramientas cerradas exclusivas para alojamiento.

La versión de rama ascendente es Apache-2.0 y está disponible públicamente a través de GitHub y Hugging Face.
Sirve como base para las variantes de rama descendente de la familia como Z-Image-Turbo y Z-Image-Edit.
Elígelo cuando el acceso a los pesos y el despliegue local sean importantes, no solo la generación de un solo clic.

Model strength

Media example pending. This block highlights the model behavior the page is describing.

Control claro por Prompt y control negativo por prompt

La documentación oficial resalta la adhesión a prompt y la modificación negativa de prompt, lo que facilita asegurar que los ajustes de prompt aparezcan claramente en los resultados.

Responde bien cuando especifiques el sujeto, la composición, el estilo y lo que se debe evitar.
Esto ayuda con los pósteres, las escenas de producto y los prompt sensibles al diseño de maquetas.
Es más fácil comparar las variaciones cuando la base prompt se mantiene estable.

Un modelo base que cubre múltiples direcciones visuales

Como modelo base no destilado, Z-Image funciona en toques realistas, diseños de póster y visuales estilizados sin necesidad de cambiar de familia de modelos.

Puede cambiar entre direcciones realistas, similares a pósteres y estilizadas sin encerrarte en un solo aspecto demasiado pronto.
Funciona bien para explorar identidades, poses, diseños y cambios de dirección artística desde la misma base prompt.
Esto es útil al principio del proceso, antes de reducirlo a una dirección final.

Model strength

Media example pending. This block highlights the model behavior the page is describing.

Model strength

Media example pending. This block highlights the model behavior the page is describing.

Entornos de ejecución locales reales y soporte para ComfyUI

Z-Image ya es compatible con diffusers, entornos de ejecución locales, herramientas de ComfyUI y paquetes de flujo de trabajo.

Hay rutas de inferencia local reales y herramientas de la comunidad en lugar de solo demostraciones alojadas.
Puedes conectarlo a LoRA, ControlNet y experimentos de flujo de trabajo personalizados.
Esto es importante cuando la implementación local forma parte de la elección del modelo.
Mejores casos de uso

Casos de uso ideales para Z-Image

Destaca en la generación dirigida por prompt, diseños de póster, visuales de estilo producto y los retoques de single-reference directamente en esta página.

Visuales de producto y marketing dirigidos por Prompt

Crea fotografías de producto, maquetas de empaque, conceptos de publicidad y visuales para páginas de destino con encuadre, materiales e iluminación más pulidos para el marketing dirigido por Prompt.

Conceptos de póster y tipografía dirigida

Aprovecha Z-Image para pósteres, gráficos para redes sociales y creaciones centradas en el diseño donde el control por prompt y el texto legible son críticos.

Retoque de imágenes basado en referencias

Comienza con una sola referencia de imagen para ajustar el estilo, el encuadre o la dirección visual sin tener que reconstruir tu concepto principal desde cero.

Uso autohospedado y orientado al flujo de trabajo

Elige Z-Image si planeas mover el modelo a ComfyUI, entornos de ejecución locales o una tubería de imágenes personalizada más adelante.

Patrones y ejemplos de Prompt

Escribe Z-Image y prompt eficaces con ejemplos del mundo real

Cada tarjeta resalta un patrón prompt, una salida real de Z-Image y los detalles de redacción clave. Abre un ejemplo para ver el prompt completo, por qué funciona y consejos para redactar prompt similares.

Imagen destacada de producto de cuidado de la piel premium

Guía probada de la industria para los flujos de trabajo de generación con las mejores prácticas de Prompt

[producto] + [ángulo de cámara] + [superficie/fondo] + [iluminación] + [acabado comercial]

Explora la documentación completa y las especificaciones técnicas de promptVer desglose completo

Desglose y descripción general completos de prompt

Una botella de cuidado de la piel de cristal premium en un pedestal de piedra beige claro, iluminación de estudio direccional suave, sombra sutil, composición editorial limpia, toma destacada de lujo para comercio electrónico, fondo mínimo, reflejos realistas, fotografía de empaque de alta gama

Componentes clave que impulsan las salidas de alta calidad de este Prompt

Este prompt coincide con el realismo, el control de iluminación y el aspecto comercial pulido de Z-Image

Resultado final generado objetivo

Una imagen de producto limpia para una página de destino, banner de escaparate o imagen destacada de la PDP

Consejos profesionales para expertos de la industria creativa

  • Nombrar el producto primero, luego bloquea el tipo de toma y la configuración de la superficie
  • Usa términos de materiales como cristal, piedra, mate o reflectante para reducir la ambigüedad

Cartel de festival de música bilingüe

Guía probada de la industria para los flujos de trabajo de generación con las mejores prácticas de Prompt

[tema del cartel] + [texto del titular] + [idioma del texto] + [jerarquía de maquetación] + [estilo de fondo]

Explora la documentación completa y las especificaciones técnicas de promptVer desglose completo

Desglose y descripción general completos de prompt

Cartel moderno de festival de música bilingüe, titular en negrita "Summer Pulse 2026", subtítulo chino más pequeño "城市电子音乐节", fondo negro con acentos naranja neón y cian, jerarquía visual clara, bloque de titular centrado, diseño de cartel de evento dinámico pero legible

Componentes clave que impulsan las salidas de alta calidad de este Prompt

Z-Image es más efectivo cuando el texto legible en chino o inglés forma parte de la idea, no solo de la decoración

Resultado final generado objetivo

Un concepto de cartel consciente del texto con un bloque de titular más claro y texto complementario legible

Consejos profesionales para expertos de la industria creativa

  • Coloca el texto exacto del titular entre comillas cuando la redacción es importante
  • Describe la jerarquía del texto de forma separada del ambiente del cartel

Actualización de empaque guiada por referencia

Guía probada de la industria para los flujos de trabajo de generación con las mejores prácticas de Prompt

[lo que se mantiene igual] + [lo que cambia] + [nueva dirección de iluminación/estilo/composición]

Explora la documentación completa y las especificaciones técnicas de promptVer desglose completo

Desglose y descripción general completos de prompt

Mantén la forma de la botella, la estructura de la tapa y la composición frontal de la imagen de referencia. Cambia el estilo de empaque por una paleta moderna blanca mate y verde salvia, luz de estudio más suave, dirección de marca de cuidado de la piel premium más limpia y presentación minorista más refinada

Componentes clave que impulsan las salidas de alta calidad de este Prompt

Esto se adapta bien a la edición de single-reference de Z-Image y mantiene la solicitud centrada

Resultado final generado objetivo

Una actualización controlada que mantiene la identidad del producto mientras mejora la dirección de empaque

Consejos profesionales para expertos de la industria creativa

  • Indica primero los elementos estables, como la forma, el encuadre o la estructura del producto
  • Mantén la solicitud de cambio limitada para que una sola imagen de referencia pueda guiarla de forma clara

Concepto rápido de anuncio social para una marca de café

Guía probada de la industria para los flujos de trabajo de generación con las mejores prácticas de Prompt

[asunto] + [dirección visual] + [composición] + [color / iluminación] + [contexto de uso]

Explora la documentación completa y las especificaciones técnicas de promptVer desglose completo

Desglose y descripción general completos de prompt

Imagen de la campaña publicitaria comercial de café con hielo, primer plano de la taza de café frío con hielo salpicando, empaque premium de café al lado de la bebida, luz diurna de verano brillante, ambiente de playa, composición enérgica, fotografía de producto nítida, estilo publicitario premium para bebidas, sin logotipos, sin nombres de marca, diseño de empaque limpio.

Componentes clave que impulsan las salidas de alta calidad de este Prompt

El prompt especifica la configuración del producto, la iluminación y el objetivo de la campaña, al tiempo que evita el texto con marca.

Resultado final generado objetivo

Una orientación publicitaria para bebidas que puedes adaptar para redes sociales de pago, promociones estacionales o el encabezado de una página de destino.

Consejos profesionales para expertos de la industria creativa

  • Menciona el canal de marketing o el contexto de uso para que la composición tenga un propósito definido.
  • Describe una acción fuerte, como una salpicadura o un primer plano, en lugar de varios movimientos que compitan entre sí.
Cuándo elegir Z-Image

Elige Z-Image por sus pesos abiertos y la flexibilidad de implementación local.

Elige Z-Image si necesitas una alineación clara con prompt, planeas reutilizar el modelo más allá de esta página o priorizas los pesos abiertos y los entornos de ejecución locales.

Elige Z-Image cuando quieras un modelo que puedas seguir usando más tarde.

Elige Z-Image cuando quieras generar aquí y ahora, luego seguir usando la misma familia de modelos en ComfyUI, entornos de ejecución locales o canalizaciones personalizadas más tarde. Encaja mejor cuando el control prompt y el acceso al modelo son importantes.

Usa otro modelo cuando quieras un estilo alojado listo para usar sin configuración adicional.

Prueba GPT-4o o Seedream cuando quieras un estilo visual integrado diferente y no te importen los pesos abiertos, los entornos de ejecución locales o la personalización posterior. Esos modelos alojados pueden resultar más directos.

Testimonio comunitario

Perspectivas y ejemplos de la comunidad para Z-Image

Estos videos, publicaciones de X y hilos de Reddit comparten la perspectiva real de la comunidad y ejemplos para Z-Image. Utilízalos como contexto complementario después de aprender los patrones básicos de prompt.

Galería de generación de videos de IA seleccionada

Publicaciones compartidas por creadores de la comunidad de la plataforma X

Hilos de conversación activos de la comunidad de Reddit

Ecosistema de código abierto

Proyectos de código abierto relevantes para Z-Image

Estos proyectos GitHub han sido evaluados por su relevancia directa con Z-Image o su familia más amplia. Úsalos para estudiar el modelo, ejecutar instancias locales o explorar las herramientas creadas por la comunidad.

Repositorio de código fuente disponible públicamente para el proyecto oficial de código abierto GitHub 01

Tongyi-MAI / Z-Image

Repositorio oficial

El repositorio ascendente Z-Image de Tongyi-MAI. Es la fuente principal de la familia de modelos 6B, checkpoints, enlaces de informes y guía oficial de inferencia.

Ir al Centro de Proyectos de Código Abierto

Repositorio de código fuente disponible públicamente para el proyecto oficial de código abierto GitHub 02

Koko-boya / Comfyui-Z-Image-Utilities

Nodos de utilidad ComfyUI

Una extensión ComfyUI creada específicamente para flujos de trabajo Z-Image, que incluye la mejora prompt, la funcionalidad prompting consciente de la imagen y un nodo de muestreo integrado.

Ir al Centro de Proyectos de Código Abierto

Repositorio de código fuente disponible públicamente para el proyecto oficial de código abierto GitHub 03

martin-rizzo / AmazingZImageWorkflow

Paquete de flujos de trabajo ComfyUI

Un paquete de flujos de trabajo para la familia Z-Image en ComfyUI con estilos predefinidos, pasos de refinamiento y escalado, además de configuraciones prehechas para los checkpoints GGUF y Safetensors.

Ir al Centro de Proyectos de Código Abierto

Repositorio de código fuente disponible públicamente para el proyecto oficial de código abierto GitHub 04

martin-rizzo / ComfyUI-ZImagePowerNodes

Nodos personalizados ComfyUI

Un conjunto de nodos personalizados ComfyUI diseñados específicamente para Z-Image y Z-Image-Turbo, con nodos auxiliares para estilos, configuración latente y ergonomía de flujos de trabajo.

166 Número total de estrellas de GitHub obtenidas en el repositorio del proyecto
MIT
Ir al Centro de Proyectos de Código Abierto
FAQs

Preguntas frecuentes

Acerca de Gemini Omni Agent y la creación conversacional

¿Qué es Z-Image?

Z-Image es el modelo base de imágenes 6B de código abierto de Tongyi-MAI, que actúa como base para la amplia familia Z-Image. Prioriza el cumplimiento de prompt, una amplia cobertura visual y un ajuste fino o implementación flexible complementaria.

¿Para qué es ideal Z-Image?

Z-Image se destaca en la generación de imágenes dirigida por prompt, conceptos de carteles, imágenes de estilo de producto y flujos de trabajo que luego pueden pasarse a ComfyUI, entornos de ejecución locales o configuraciones de autoalojamiento.

¿Soporta Z-Image image-to-image aquí?

Absolutamente. Esta herramienta soporta tanto text-to-image como single-reference image-to-image para Z-Image. Utilice una imagen de referencia para bloquear la forma, el encuadre o la dirección visual principal de su generación.

¿Qué relaciones de aspecto soporta Z-Image aquí?

Z-Image soporta 1:1, 4:3, 3:4, 16:9 y 9:16 en esta página, cubriendo relaciones de aspecto estándar cuadradas, verticales, horizontales y orientadas a redes sociales para la creatividad.

¿Cómo escribir mejores prompt para Z-Image?

Empiece por su sujeto, luego agregue detalles sobre el estilo, la composición, la iluminación, los materiales y el texto necesario. Z-Image funciona mejor cuando separa claramente los elementos obligatorios de los flexibles, especialmente para carteles, imágenes de producto y ediciones de single-reference.

¿Cuándo debo usar Z-Image en lugar de GPT-4o o Seedream 4?

Elija Z-Image si desea un modelo abierto que pueda usar más allá de una herramienta alojada, especialmente si el control de prompt o el autoalojamiento son prioridades. Opte por GPT-4o o Seedream 4 cuando quiera su estilo integrado y flujo de trabajo alojado sin personalización adicional.

¿Cuál es la diferencia entre Z-Image y Z-Image-Turbo?

Z-Image es el modelo base principal de la familia. Z-Image-Turbo es una variante destilada optimizada para una inferencia más rápida y ligera, por lo que muchos flujos de trabajo de la comunidad y implementaciones locales destacan específicamente Turbo.

¿Puedo usar imágenes de Z-Image de forma comercial?

Los pesos de Z-Image se publican bajo Apache-2.0, pero el uso comercial de los activos generados depende de su caso de uso, los estándares de cumplimiento y los términos de la plataforma aplicable. Siempre realice revisiones legales y de marca estándar para el trabajo de producción, no suponga que la salida del modelo está automáticamente autorizada.

¿Es Z-Image de código abierto y se puede autoalojar?

Sí. Tongyi-MAI publicó Z-Image de forma oficial, y el modelo ya está disponible a través de rutas basadas en diffusers, entornos de ejecución locales, herramientas de ComfyUI y paquetes de flujos de trabajo. Esto lo hace más fácil de estudiar, implementar y adaptar que los modelos cerrados solo alojados.

¿Todavía tienes preguntas? Estamos aquí para ayudarte

Unirse a Discord
Modelos relacionados

Compara Z-Image con otros modelos de imágenes en esta plataforma.

Si Z-Image no se adapta a tu flujo de trabajo, revisa estas páginas de modelos relacionados para comparar la alineación con prompt, el estilo visual y los casos de uso principales.

Generador de imágenes GPT-4o

Prueba GPT-4o cuando quieras un modelo de imágenes alojado de propósito general para conceptualizar, editar y tener un sesgo visual diferente.

Navegar por los modelos de IA asociados seleccionados

Generador de imágenes Flux 2

Explora Flux 2 cuando quieras otra vía para la generación de imágenes pulidas con una respuesta prompt y un sesgo visual diferentes.

Navegar por los modelos de IA asociados seleccionados

Generador de imágenes Seedream 4

Compara Z-Image con Seedream 4 cuando quieras una dirección más estilizada o cinematográfica para los resultados creativos.

Navegar por los modelos de IA asociados seleccionados

Generador de imágenes Qwen 2

Abre Qwen 2 para obtener otro modelo de imágenes liderado por prompt con generación basada en referencias y un estilo de salida diferente.

Navegar por los modelos de IA asociados seleccionados

Prueba Z-Image ahora en esta página

Abre el generador, empieza con un prompt o una sola imagen de referencia, y usa Z-Image para la generación controlada de text-to-image y ediciones sencillas de single-reference aquí.

Recursos
  • Blog
  • Crear
  • Escenas
  • Portafolio
  • Prompts
  • Imagen a Prompt
  • Imagen a Prompt por Lotes
Empresa & Legal
  • Acerca de
  • Contacto
  • Política de Privacidad
  • Términos de Servicio
  • Política de Reembolsos
Image Models
  • Z-Image
  • GPT-4o
  • Flux 2
  • Flux 2 Pro
  • Flux 2 Klein
  • Qwen Image 2
  • Seedream 4.0
  • Seedream 4.5
  • Seedream 5.0
  • Grok Imagine
  • Gemini 3 Pro Image
  • Nano Banana Flash
  • Nano Banana 2
Video Models
  • Google Veo 3.1
  • Google Veo 3.1 Lite
  • Google Veo 3.1 Pro
  • Seedance 1.5 Pro
  • Seedance Fast
  • Seedance Quality
  • Seedance 2.0
  • Hailuo 02
  • Kling v2.6
  • Kling v2.5 Turbo
  • Kling v2.1
  • Kling v2.1 Master
  • Kling O1
  • Kling v3.0
  • Kling v3.0 Pro
LogoGemini Omni

Gemini Omni | Creación de vídeo e imágenes conversacional

TwitterX (Twitter)DiscordEmail

Gemini Omni es una plataforma creativa independiente para flujos de trabajo de vídeo e imágenes con IA conversacional. Google, Gemini, Veo y otras marcas comerciales pertenecen a sus respectivos propietarios.

© 2026 Gemini Omni All Rights Reserved. DREAMEGA INFORMATION TECHNOLOGY LLC

[email protected]