La generación de imágenes de Gemini obtiene una actualización importante, y las gemas personalizadas finalmente se están implementando

Google está lanzando algunas actualizaciones hoy (agosto 28) para su modelo AI, Gemini, para la generación de imágenes y gemas personalizadas. Los usuarios que buscan ayuda a través de las aplicaciones Gemini están siendo tratados con una actualización de Imagen 3. Google reitera eso Imagen 3 es su nuevo «estándar» para «generar imágenes en pocas palabras.» La compañía afirma que los usuarios pueden crear paisajes fotorrealistas e imágenes que reflejan pinturas al óleo.

Además, Google promociona Imagen 3’s capacidad de entender el discurso natural de un usuario para comprender la intención detrás de su descripción. El despliegue de Imagen 3 en las aplicaciones Gemini permanecerá fijo en animales, plantas y otros objetos al principio. Google afirma que «en los próximos días», funcionará para brindar la capacidad de describir y hacer que Gemini cree imágenes de personas. Esto está programado para llegar al acceso temprano para los usuarios de Gemini Advanced, Business y Enterprise en inglés. A pesar de que Imagen 3 le da al usuario el control total sobre su generación de texto a imagen proceso, Google ha establecido límites para las fotos de personas. Por ejemplo, el software no admitirá fotos fotorrealistas o creaciones «individuales identificables».

La actualización final, que involucra a los usuarios de Gemini Advanced, Business y Enterprise, trae «gemas personalizadas» para el modelo de IA. El comunicado de prensa afirma que estos usuarios pronto pueden comenzar a «crear y chatear» con su variante Gemini hecha a medida. Esta fue una característica de Google burlado durante la E/S 2024, que permite a los usuarios ajustar Gemini para una necesidad específica.

A medida que se desarrolle en «los próximos días, Google dice que los usuarios encontrarán algunas opciones de Gem personalizadas prefabricadas para Gemini. Se dice que «Learning Coach» ayuda a desglosar la información para los usuarios que están aprendiendo un tema nuevo o difícil por primera vez. La opción «Brainstormer» está orientada a ofrecer inspiración para una variedad de temas.

Las opciones prefabricadas restantes son las siguientes:

  • Guía de carrera: desbloquea su potencial profesional con planes detallados para refinar sus habilidades y alcanzar sus objetivos profesionales
  • Editor de escritura: puede elevar su escritura a través de comentarios claros y constructivos, sobre todo, desde la gramática hasta la estructura.
  • Socio de codificación: aumenta sus habilidades de codificación y puede ayudarlo a construir proyectos y aprender a medida que avanza.

Más importante aún, aquellos que crean una Gema personalizada deben ser lo más descriptivos posible. Google explica que los usuarios puedan instruir la variante personalizada de Gemini sobre su propósito y «cómo debe responder.»

Los usuarios pueden dirigirse a la aplicación Gemini en el escritorio o el móvil para encontrar gemas y la capacidad de crear las suyas propias. La mayoría de los idiomas son compatibles ya que Google inicia su lanzamiento global. Aquellos interesados en probar lo que es nuevo para Gemini antes de que alguien más pueda inscribirse Gemini Avanzado o Gemini para Workspace.