Es capaz de generar, comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación.
Google anunció Gemini, su nuevo modelo de IA multimodal, el más avanzado que ha desarrollado hasta la fecha. Gemini es capaz de generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación. También es el modelo más flexible hasta el momento, capaz de ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos.
Gemini Ultra, Gemini Pro y Gemini Nano
Gemini 1.0, la primera versión de este modelo, se ha optimizado en tres dimensiones diferentes:
Basado en tecnología de última generación
Hasta el momento, el método estándar para crear modelos multimodales consistía en entrenar componentes separados para distintas modalidades, y luego unirlos para imitar a grandes rasgos algunas de sus funciones. A veces, estos modelos pueden ser buenos en determinadas tareas, como la descripción de imágenes, pero tienen algunas dificultades con el razonamiento más conceptual y complejo.
Por eso, Google diseñó Gemini para que fuera un modelo de IA multimodal de forma nativa, es decir, previamente entrenado en diferentes modalidades (y desde el inicio). Se perfeccionó con datos multimodales adicionales para poder mejorar su eficacia. Esto ayuda a Gemini a comprender y razonar sin problemas todo tipo de entradas desde el principio, mucho mejor que los modelos multimodales existentes, y sus capacidades son de vanguardia en casi todos los ámbitos.
Pruebas comparativas
Este nuevo modelo de IA se ha puesto a prueba rigurosamente y evaluando su rendimiento en una amplia variedad de tareas que abarcan: desde la comprensión de imágenes naturales, audio y video, hasta codificación y el razonamiento matemático. El desempeño de Gemini Ultra supera 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de grandes modelos lingüísticos.
Gemini a disposición del mundo
Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:
De cara al futuro
La versión Ultra de Gemini se encuentra ahora en etapa de pruebas de seguridad con socios externos y la abriremos a un grupo de usuarios, desarrolladores y clientes para una experimentación temprana a comienzos del próximo año.
La era Gemini
Esto es un hito importante en el desarrollo de la Inteligencia Artificial y el comienzo de una nueva era para Google, a medida que continúa innovando rápidamente y avanzando de manera responsable en las capacidades de cada uno de los nuevos modelos. Hasta el día de hoy, la compañía ha alcanzado grandes progresos con “Gemini” y seguirá trabajando arduamente para ampliar aún más sus capacidades para versiones futuras.
Más información
Los links con el detalle de cada uno de los anuncios son de The Keyword, el blog oficial de Google en inglés. Si preferís esperar a la traducción, próximamente estará disponible toda la información en Esto es Google.
El británico terminó tercero y con este resultado le alcanzó para consagrarse campeón por primera…
En Argentina el crecimiento del pentecostalismo es constante. Casi el 20% de la población encuentra…
“Los Monos la empezaron a denominar «Te hice pica: te descubrí vendiendo y ahora me…
Podría reducirse el valor de algunos hasta $16 millones de pesos. Analistas advierten que la…
La intervención llevada adelante en el emblemático espacio completa la serie de obras planificadas para…
Las sesiones extraordinarias comenzarán el miércoles y se extenderán al 30 de diciembre y la…