La inteligencia artificial (IA) generativa estuvo en el centro del escenario en el Google I/O 2024, donde la compañía presentó importantes actualizaciones para su plataforma Gemini, nuevas funciones de búsqueda basadas en IA y un vistazo al futuro de la asistencia virtual con Project Astra, un ambicioso proyecto para crear asistentes virtuales multimodales más inteligentes y humanos, que rivalicen con el GPT-4 de OpenAI
Estas innovaciones se enmarcan en la estrategia de Google por potenciar las capacidades de sus productos y servicios a través de la IA. La empresa busca ofrecer experiencias más personalizadas, eficientes y contextualizadas a sus usuarios, tanto en el ámbito personal como profesional.
Gemini se vuelve más potente y accesible
Google presentó Gemini 1.5 Flash, una versión más ligera y rápida de su modelo de IA generativa, optimizada para tareas de alto volumen y eficiencia. Esta variante, junto con las mejoras en Gemini 1.5 Pro, aumenta la capacidad de procesamiento de información, la comprensión del lenguaje natural y la fluidez en las conversaciones.
Gemini 1.5 Pro ahora puede manejar 2 millones de tokens, el doble que su versión anterior, permitiendo respuestas más complejas y matices en formato y estilo. Además, se ha mejorado la comprensión de audio e imagen, abriendo la puerta a experiencias más completas en productos como YouTube, Maps y Gmail.
Gemini Nano, la versión móvil de Gemini, ahora también admite contenido multimodal, procesando audio, imágenes y texto.
Gemma 2: la próxima generación de modelos de lenguaje abierto
Google presentó la segunda generación de su familia de modelos de lenguaje de código abierto, Gemma 2. Esta nueva arquitectura ofrece un rendimiento y eficiencia optimizados, y estará disponible en nuevos tamaños para ampliar sus casos de uso.
PaliGemma, el primer modelo de visión y lenguaje de Google inspirado en PaLI-3, se une a la familia Gemma.
Project Astra: hacia un asistente de IA conversacional al estilo Her
Google está trabajando en Project Astra, una iniciativa que busca desarrollar asistentes digitales basados en IA capaces de comprender y responder al mundo como lo hacen las personas.
El objetivo es crear agentes de servicio virtuales proactivos, didácticos y personales. Los avances presentados en el I/O 2024 muestran soluciones construidas sobre la plataforma Gemini y otros modelos, con la expectativa de integrarse en productos de Google a finales de este año.
Image 3 y Veo: revolucionando la producción audiovisual
Google presentó dos nuevos modelos de IA para optimizar la producción audiovisual:
- Image 3, el sistema de texto a imagen de Google, ahora es más robusto y capaz de crear imágenes más realistas con menos elementos innecesarios.
- Veo es un nuevo sistema de generación de video que, a partir de indicaciones de texto, puede producir materiales de más de un minuto con resolución de 1080 píxeles.
El Google I/O 2024 marcó un avance significativo en la apuesta de Google por la IA generativa, con importantes novedades en Gemini y Gemma, búsquedas en video y la visión de un futuro con asistentes de IA conversacionales más naturales y personales, la introducción de Project Astra y nuevas herramientas para la producción audiovisual. Google busca así posicionarse como líder en este campo, con el objetivo de crear soluciones de IA más intuitivas, eficientes y útiles para los usuarios.