Opinión

Todo lo que necesitas saber de Google Gemini

Por Guillermo Pérezbolde

Google acaba de dar un paso de gigante con el lanzamiento de Gemini


En un momento de euforia por la IA, Google acaba de dar un paso de gigante con el lanzamiento de Gemini: un ambicioso modelo de lenguaje capaz de generar respuestas largas y conversaciones coherentes con información relevante sobre cualquier tema que se le plantee. Gemini es una pieza clave para Google en esta competencia que cada día es más feroz, con empresas como Open AI, Microsoft, IBM, Apple y Adobe mostrando herramientas que sorprenden por los alcances que logran, donde parece que no habrá límite.

 Con Gemini Google ha diseñado una arquitectura novedosa que le permite obtener contexto de preguntas más extensas, conectando múltiples partes del texto para generar respuestas detalladas y precisas. Esto se integra de forma natural en las búsquedas de Google para brindar más valor a los usuarios.

Un aspecto clave, es que Gemini no está conectada a ninguna base de datos ni fuente de información externa como lo hacen otros sistemas. En este caso, sintetiza por sí mismo los datos basándose en patrones que ha aprendido de una enorme colección de libros, artículos, investigaciones y páginas web indexadas por el buscador.

Cómo funciona Gemini 

 La arquitectura de Gemini se basa en varias innovaciones recientes en modelos de lenguaje generativos. Su sistema está compuesto por múltiples módulos especializados que interactúan entre sí para analizar las consultas, recopilar información relevante y generar respuestas en lenguaje natural(NLP).

Algo sorprendente es que puede juntar fragmentos de información de forma similar al pensamiento humano. Esto se debe a que cuenta con módulos dedicados a sintetizar datos provenientes de diversas partes en una respuesta coherente y bien organizada.

 También identifica carencias en la comprensión y destaca preguntas adicionales que necesitarían hacerse para perfeccionar la respuesta. Esto es algo que hace un humano cuando no entiende una pregunta.

Gemini tiene la capacidad de hacer referencias cruzadas: puede incluir información que ya ha mencionado previamente en la conversación para sus futuras respuestas, dando contexto extra sin repetirse. Esto permite que las conversaciones sean más naturales y útiles conforme avanzan.

Algo muy innovador de Gemini es que fue creado en tres dimensiones o modelos:

 Nano, el modelo enfocado a tareas en dispositivos móviles.

Pro es el modelo pensado para escalar una amplia gama de tareas

 Ultra, el modelo de mayor capacidad para tareas complejas.

 En Bard Gemini Pro será el nuevo motor de IA y en varias pruebas superó en velocidad y capacidad de razonamiento a Chat GPT en la version 4.

 La incorporación de Gemini en las búsquedas de Google representa uno de los usos prácticos más novedosos de la IA hasta la fecha.

Se ha entrenado desde cero para proveer resultados relevantes y confiables, logrando lo que hasta ahora no habían podido conseguir. El objetivo principal es que los usuarios cuenten con un asistente virtual con información sobre cualquier tema, ofreciendo respuestas directas a sus preguntas en lugar de solamente una lista de enlaces.

Esto marca un nuevo paradigma en la forma de buscar datos, pues entrega conocimiento sintetizado y relevante a las consultas del usuario.

Herramientas como Wolfram Alfa, Perplexity y Aria ya tenían esto como una función natural; ahora lo tendremos directamente en una búsqueda en Google.

Gemini en la práctica 

 Entre los usos prácticos que planea Google en un futuro próximo se incluyen sistemas avanzados de reservas de viajes, por medio de su plataforma de hoteles y vuelos. También considera que se puede utilizar para dar soporte al cliente automatizado y asistencia médica basada en IA, algo que hasta el momento era dominado por IBM.

Los usos más fuertes están relacionados con la toma de decisiones, donde la IA podrá dar alternativas basadas en datos para ayudar en situaciones complicadas, ya sea para desastres naturales, legales o médicas donde se requiera un sustento técnico para cada decisión. Gemini promete que será al menos en 2024, la plataforma más avanzada, pero compañías como Open AI, Microsoft e IBM, prometen herramientas que compiten con la innovación que Google tiene preparada.

 El conocimiento que no se comparte, pierde por completo su valor.