Después de una larga espera, el gigante tecnológico Google presentó su modelo de Inteligencia Artificial Generativa Gemini, la apuesta de la compañía para competir con el modelo más popular a nivel global ChatGPT, de la también estadounidense OpenAI.
Gemini sucede a varios modelos de Inteligencia Artificial que Google DeepMind, la división de Google dedicada a esta tecnología, ha lanzado en años recientes, entre los que se encuentran AlphaGo, el motor que venció al campeón internacional del juego Go; BERT, LaMDA y PaLM.
La competencia de Gemini con ChatGPT será intensa. De acuerdo con un análisis de Sujan Sarkar para Writterbuddy, el cual analiza el tráfico de 3,000 herramientas de Inteligencia Artificial entre septiembre de 2022 y agosto de 2023, 50 aplicaciones de IA han registrado 24,000 millones de visitas en este periodo. Por sí sola, ChatGPT ha registrado 14,000 millones de visitas a la aplicación, 60% del total.
El modelo Gemini de Google, que también compite con Llama de Meta y que es soportado por los chips de Inteligencia Artificial más recientes lanzados por Google, los TPUv5p, cuenta con tres características básicas:
- Multimodal: Puede ser entrenado a partir de datos de diferente tipo, ya sean texto imágenes, audio o código.
- Habilidades sofisticadas de razonamiento: Tiene la capacidad de distinguir información valiosa entre grandes cantidades de datos.
- Habilidades avanzadas de código: Gemini es la base del generador de código profesional AlphaCode 2, que ayuda a eficientar el proceso de desarrollo de código de un programador humano.
De acuerdo con Eli Collins, vicepresidente de Producto de Google DeepMind, Gemini es el primer modelo de Inteligencia Artificial que en 90% de las ocasiones supera a seres humanos expertos en MMLU (Massive Multitask Language Understanding), un punto de referencia diseñado para medir el conocimiento adquirido durante el entrenamiento de modelos en materias que van desde la historia y las matemáticas hasta la ética y el derecho.
“Gemini es lo más avanzado en una amplia gama de pruebas de referencia (benchmarks), como mencioné 30 de 32 de los más utilizados en la comunidad de investigación de aprendizaje automático (machine learning). Y por eso vemos que establece nuevas fronteras en todos los ámbitos”, dijo Collins en conferencia de prensa.
Gemini estará disponible en tres escalas distintas:
- Gemini Ultra: el modelo más grande para tareas extremadamente complejas.
- Gemini Pro: un modelo capaz de escalar para realizar una variedad de tareas distintas
- Gemini Nano: un modelo diseñado para trabajar de forma eficiente desde un dispositivo móvil.
Gemini llega a Bard
El nuevo modelo de Inteligencia Artificial de Google hace su presentación de la mano del chat conversacional de la compañía Bard. En una primera etapa, a partir de este 6 de diciembre de 2023, Bard será potenciado por la versión Pro de Gemini en idioma inglés, lo que permitirá que la herramienta desglose cada elemento de la solicitud que se le realice; ofrezca una respuesta más precisa y explique su respuesta. A principios de 2024, Gemini Ultra será incorporado a Bard en una versión que Google ha llamado Bard Advanced.
Esta versión de Gemini también estará disponible para los clientes de Google AI Studio y Google Cloud Vertex AI, las versiones corporativas de la Inteligencia Artificial de Google, a partir del 13 de diciembre. Mientras que la versión Nano estará disponible para los usuarios de los teléfonos inteligentes Pixel 8 Pro./Agencias-PUNTOporPUNTO