Categorías: Sociedad

Google presenta Gemini, su modelo de IA multimodal más avanzado

Es capaz de generar, comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación.

Google anunció Gemini, su nuevo modelo de IA multimodal, el más avanzado que ha desarrollado hasta la fecha. Gemini es capaz de generar y comprender, operar y combinar a la perfección diferentes tipos de información, incluyendo texto, imágenes, audios, videos y lenguajes de programación. También es el modelo más flexible hasta el momento, capaz de ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos.

Gemini Ultra, Gemini Pro y Gemini Nano

Gemini 1.0, la primera versión de este modelo, se ha optimizado en tres dimensiones diferentes:

Gemini Ultra: el modelo de mayor capacidad y tamaño para tareas complejas
Gemini Pro: el mejor modelo para escalar una amplia gama de tareas
Gemini Nano: el modelo más eficiente para tareas en dispositivos móviles

Basado en tecnología de última generación

Hasta el momento, el método estándar para crear modelos multimodales consistía en entrenar componentes separados para distintas modalidades, y luego unirlos para imitar a grandes rasgos algunas de sus funciones. A veces, estos modelos pueden ser buenos en determinadas tareas, como la descripción de imágenes, pero tienen algunas dificultades con el razonamiento más conceptual y complejo.

Por eso, Google diseñó Gemini para que fuera un modelo de IA multimodal de forma nativa, es decir, previamente entrenado en diferentes modalidades (y desde el inicio). Se perfeccionó con datos multimodales adicionales para poder mejorar su eficacia. Esto ayuda a Gemini a comprender y razonar sin problemas todo tipo de entradas desde el principio, mucho mejor que los modelos multimodales existentes, y sus capacidades son de vanguardia en casi todos los ámbitos.

Pruebas comparativas

Este nuevo modelo de IA se ha puesto a prueba rigurosamente y evaluando su rendimiento en una amplia variedad de tareas que abarcan: desde la comprensión de imágenes naturales, audio y video, hasta codificación y el razonamiento matemático. El desempeño de Gemini Ultra supera 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de grandes modelos lingüísticos.

Gemini a disposición del mundo

Gemini 1.0 se encontrará disponible en una serie de productos y plataformas:

Para usuarios:
- A partir de hoy, Bard con Gemini Pro estará disponible en inglés en más de 170 países y territorios. Esta herramienta será más capaz en cuestiones como comprender y resumir, razonar, generar ideas, escribir y planificar. Esta es la mayor mejora de calidad de Bard desde su lanzamiento.
- También se llevará “Gemini” a Pixel 8 Pro, el primer teléfono inteligente diseñado para ejecutar Gemini Nano que impulsa nuevas funciones como resumir en la aplicación de Grabadora e implementar Redacción Inteligente en Gboard, comenzando con WhatsApp, y el próximo año se incluirán más aplicaciones de mensajería.
Para clientes y desarrolladores:
- A partir del 13 de diciembre, desarrolladores y clientes podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio y en Vertex AI.
- Ai Studio es una herramienta web gratuita que ayuda a desarrolladores a prototipar y lanzar aplicaciones de manera rápida y sencilla.
- Vertex AI, por su parte, permite una personalización de Gemini con control total sobre los datos y suma los beneficios de Google Cloud como seguridad, privacidad, gobernanza de datos y compliance de nivel corporativo.
- Los desarrolladores de Android podrían crear aplicaciones sobre Gemini Nano, nuestro modelo más eficiente para dispositivos móviles, a través de AI Core.

De cara al futuro

La versión Ultra de Gemini se encuentra ahora en etapa de pruebas de seguridad con socios externos y la abriremos a un grupo de usuarios, desarrolladores y clientes para una experimentación temprana a comienzos del próximo año.

La era Gemini

Esto es un hito importante en el desarrollo de la Inteligencia Artificial y el comienzo de una nueva era para Google, a medida que continúa innovando rápidamente y avanzando de manera responsable en las capacidades de cada uno de los nuevos modelos. Hasta el día de hoy, la compañía ha alcanzado grandes progresos con “Gemini” y seguirá trabajando arduamente para ampliar aún más sus capacidades para versiones futuras.

Más información

Los links con el detalle de cada uno de los anuncios son de The Keyword, el blog oficial de Google en inglés. Si preferís esperar a la traducción, próximamente estará disponible toda la información en Esto es Google.

diciembre 7, 2023

Aseguran que qué las mujeres eligen renunciar a sus trabajos antes de volver a la presencialidad 100%
El regreso rígido a la oficina colisiona con la “doble jornada”. Expertas afirman que priorizan…
Por qué hay que armar el árbol de Navidad este lunes 8 de diciembre
Se acerca uno de los primeros momentos familiares de la temporada festiva
Recuperar la fertilidad luego del cáncer: la cirugía robótica marca un nuevo estándar
Por primera vez en Argentina se realizó un autotrasplante de tejido ovárico asistido por un…

¡Lando Norris es el nuevo campeón mundial de Fórmula 1!

El británico terminó tercero y con este resultado le alcanzó para consagrarse campeón por primera…

diciembre 7, 2025

Política

La avanzada pentecostal: bancada propia y un predicador multimillonario que se pone el traje presidencial

En Argentina el crecimiento del pentecostalismo es constante. Casi el 20% de la población encuentra…

diciembre 7, 2025

Ciudad

«Te hice pica»: la jerga narco que destapó la ambición de Los Monos y el negocio de la droga en Rosario

“Los Monos la empezaron a denominar «Te hice pica: te descubrí vendiendo y ahora me…

diciembre 7, 2025

Sobre Ruedas

¿Bajan los precios de los autos? Expectativa por la quita de impuestos internos a los 0Km

Podría reducirse el valor de algunos hasta $16 millones de pesos. Analistas advierten que la…

diciembre 7, 2025

Ciudad

Este domingo se inaugura la renovada plaza 25 de Mayo

La intervención llevada adelante en el emblemático espacio completa la serie de obras planificadas para…

diciembre 7, 2025

Política

Presupuesto: oficialismo busca aprobar la ley de gastos de 2026 en 20 días: plan y cronograma

Las sesiones extraordinarias comenzarán el miércoles y se extenderán al 30 de diciembre y la…

diciembre 7, 2025

Google presenta Gemini, su modelo de IA multimodal más avanzado

Entrada Relacionada

Entradas recientes

¡Lando Norris es el nuevo campeón mundial de Fórmula 1!

La avanzada pentecostal: bancada propia y un predicador multimillonario que se pone el traje presidencial

«Te hice pica»: la jerga narco que destapó la ambición de Los Monos y el negocio de la droga en Rosario

¿Bajan los precios de los autos? Expectativa por la quita de impuestos internos a los 0Km

Este domingo se inaugura la renovada plaza 25 de Mayo

Presupuesto: oficialismo busca aprobar la ley de gastos de 2026 en 20 días: plan y cronograma