Google presentó su último software de generación de texto a imagen, Imagen 2, ahora «generalmente» disponible para AI Vertex clientes. La compañía anunció la actualización en una nube de Google publicó, afirmando que el software más nuevo trae seis características con su debut.
El primero involucra imágenes de «alta calidad», ya que Google afirma que Imagen 2 puede crear una salida «fotorrealista», ya que entiende mejor lo que los usuarios pretenden manifestar.
Esto probablemente va de la mano con el soporte de renderizado de texto de Imagen 2. El propósito de esto es dar a los clientes más control sobre sus indicaciones de texto a imagen. Esencialmente, este soporte ayuda a garantizar que la raíz del mensaje de un usuario permanezca constante a lo largo de la generación de imágenes del software, lo cual es un problema que Google agrega que es común en la industria.
Imagen 2 en Vertex AI permitirá a las empresas crear logotipos, emblemas y lettermarks multipropósito. La compañía agrega que los usuarios pueden tomar sus creaciones y colocarlas en productos, tarjetas de visita, ropa y otras superficies no especificadas.
Los subtítulos ayudan a que Internet siga siendo inclusivo para todos, por lo que Imagen 2 permite a los usuarios crear subtítulos «descriptivos y de formato largo» para lo que creen. Además, puede consultar sobre la imagen que ha creado con el chatbot de AI, y proporcionará una respuesta a medida.
Imagen 2 se lanza en inglés junto con soporte para chino, hindi, japonés, coreano, portugués y español en preview. Google afirma que más idiomas están programados para ser compatibles a principios de 2024. Los usuarios también pueden comenzar un mensaje en un idioma, pero instruir al bot de IA para que emita la respuesta en otro probablemente útil para los subtítulos.
La inclusión de Google Cloud de la influencia de Imagen 2 no viene sin parámetros de seguridad. La compañía agrega que el software permanece dentro del ámbito de sus directores de IA con barandillas para garantizar que los usuarios no puedan solicitar al bot que cree algo dañino. Las marcas de agua también están disponibles a través de SynthID de DeepMind para proteger las creaciones hechas para las empresas.
Con los clientes de Vertex AI teniendo en sus manos Imagen 2, Google instruye a los interesados a comunicarse con su representante de Google Cloud para unirse al Programa Trusted Tester. Del mismo modo, la generación de imágenes documentación puede proporcionar información adicional.
Imagen 2 ahora se une a la Modelo Gemini Pro en Vertex AI, diseñado para manejar una «amplia gama» de tareas. Los desarrolladores en el estudio de IA de Google también pueden comenzar a integrar el modelo en sus aplicaciones de Android. Hacerlo permitirá que su aplicación se escape de los centros de datos de Google sin requerir una estructura de backend completamente nueva.
La empresa detallada Las otras dos formas de Gemini, Nano y Ultra, la semana pasada. El primero es apto para tareas en el dispositivo y, como tal, se ha implementado en el Pixel 8 durante su primera caída de características. Este último, mucho más grande para tareas altamente complejas, brillará a principios de 2024.