O Google I/O 2026 amosa un futuro protagonizado por axentes de IA

martes, 19 de maio do 2026 Redacción

Google aproveitou a conferencia para desenvolvedores Google I/O 2026 para presentar unha profunda evolución da súa estratexia arredor da intelixencia artificial, situando Gemini no centro dunha nova xeración de produtos e servizos axénticos, capaces de actuar de maneira autónoma, persistente e contextualizada. O director executivo de Google, Sundar Pichai, destacou que a compañía de Mountain View entra nunha nova fase na que a IA deixa de limitarse á xeración de texto para converterse nun sistema capaz de executar tarefas complexas, comprender o mundo e interactuar de maneira continua cos usuarios.
A escala do crecemento da infraestrutura e dos servizos de IA converteuse nun dos grandes argumentos do evento. Google asegura procesar actualmente máis de 3.200 billóns de tokens ao mes, sete veces máis ca hai un ano. Tamén salientou a adopción das súas plataformas entre empresas e desenvolvedores: máis de 8,5 millóns de programadores utilizan mensualmente os modelos Gemini, mentres centos de clientes de Google Cloud xa procesan máis dun billón de tokens cada un.
A Busca continúa a ser o principal escaparate tecnolóxico da compañía. O chamado Modo IA supera xa os mil millóns de usuarios activos mensuais, mentres as Vistas Creadas con IA alcanzan os 2.500 millóns. Google considera que o buscador está a transformarse nun sistema conversacional permanente, no que as respostas deixan de ser simples listaxes de ligazóns para ofrecer experiencias dinámicas e personalizadas.
A aplicación Gemini tamén experimentou un forte crecemento, pasando de 400 a máis de 900 millóns de usuarios activos mensuais nun ano. Entre as novidades máis destacadas figura Gemini Spark, un novo axente persoal persistente capaz de actuar en segundo plano sobre tarefas prolongadas. Este sistema poderá integrarse con ferramentas propias de Google e tamén con servizos de terceiros mediante MCP. Spark funcionará tanto na aplicación Gemini como posteriormente en Chrome, onde actuará como un navegador axéntico capaz de executar accións directamente na web.
Google tamén presentou unha nova xeración de experiencias conversacionais integradas nos seus produtos. Pregunta a YouTube permitirá formular consultas complexas en linguaxe natural e acceder directamente aos fragmentos relevantes dos vídeos. Pola súa banda, Documentos Live transformará a creación de documentos mediante control por voz, permitindo ditar, editar e estruturar contidos oralmente sen empregar o teclado.
Google anunciou tamén a oitava xeración das súas TPU, dividida en dous chips especializados: TPU 8t para adestramento de modelos e TPU 8i para inferencia. A compañía asegura que o novo sistema permite distribuír o adestramento entre máis dun millón de TPU repartidas globalmente, reducindo drasticamente os tempos necesarios para desenvolver modelos de gran tamaño. Google prevé investir arredor de 190.000 millóns de dólares en infraestrutura este ano, fronte aos 31.000 millóns de 2022.
Outro dos anuncios centrais foi Gemini Omni, un modelo multimodal capaz de xerar vídeo, e posteriormente tamén imaxes e texto, a partir de calquera tipo de entrada. A primeira versión comercial será Gemini Omni Flash, xa dispoñible na aplicación Gemini, Google Flow e YouTube Shorts. Este sistema combina as capacidades lingüísticas de Gemini cos modelos multimedia desenvolvidos por Google.
A transparencia do contido xerado por IA tamén tivo protagonismo no evento. Google ampliará o uso de SynthID, o seu sistema de marca de auga invisible, que xa se utilizou para etiquetar máis de 100.000 millóns de imaxes e vídeos. Ademais, OpenAI, Kakao e Eleven Labs incorporaranse como socios da tecnoloxía. Google tamén integrará as Credenciais de Contido en Busca e Chrome para facilitar a identificación de materiais creados ou modificados mediante IA.
No ámbito dos modelos de IA, Gemini 3.5 Flash converteuse nun dos principais protagonistas. Google presume de que supera en numerosos indicadores ao anterior Gemini 3.1 Pro, cun rendemento especialmente destacado en programación e tarefas axénticas. Afirman que o novo modelo ofrece velocidades de xeración moi superiores ás doutros modelos avanzados do mercado, mantendo custos significativamente máis baixos.
A plataforma Antigravity evoluciona paralelamente cara a un sistema de coordinación de axentes autónomos. A nova versión Antigravity 2.0 incorpora unha aplicación independente para escritorio desde a que organizar e supervisar múltiples axentes de IA. Google asegura que determinadas versións optimizadas poden ser ata doce veces máis rápidas ca outros modelos de referencia.
A integración da IA esténdese tamén ao ecosistema Android. O novo espazo Android Halo permitirá supervisar en tempo real o estado das tarefas executadas polos axentes de Gemini.
Google Flow recibiu novas capacidades centradas na creación multimedia mediante axentes especializados, mentres Google Pics se presenta como unha ferramenta avanzada de edición de imaxes baseada no modelo Nano Banana, capaz de tratar os distintos elementos dunha escena como obxectos independentes editables.
A investigación científica tamén entra na folla de ruta da IA axéntica con Gemini for Science, unha plataforma que combina ferramentas de razoamento profundo, acceso a bases de datos científicas e integración con Antigravity para acelerar tarefas de investigación en ciencias biolóxicas.
O discurso de Google en I/O 2026 deixa clara unha orientación estratéxica: a compañía pretende que Gemini deixe de ser un simple asistente conversacional para converterse nunha infraestrutura transversal capaz de actuar de maneira autónoma sobre produtos, servizos e fluxos de traballo completos.

Vídeo da presentación inaugural de Google I/O 2026