O Google I/O 2026 amosa un futuro protagonizado por axentes de IA
martes, 19 de maio do 2026
Google aproveitou a conferencia para desenvolvedores Google I/O 2026 para presentar unha profunda evolución da súa estratexia arredor da intelixencia artificial, situando Gemini no centro dunha nova xeración de produtos e servizos axénticos, capaces de actuar de maneira autónoma, persistente e contextualizada. O director executivo de Google, Sundar Pichai, destacou que a compañÃa de Mountain View entra nunha nova fase na que a IA deixa de limitarse á xeración de texto para converterse nun sistema capaz de executar tarefas complexas, comprender o mundo e interactuar de maneira continua cos usuarios.
A escala do crecemento da infraestrutura e dos servizos de IA converteuse nun dos grandes argumentos do evento. Google asegura procesar actualmente máis de 3.200 billóns de tokens ao mes, sete veces máis ca hai un ano. Tamén salientou a adopción das súas plataformas entre empresas e desenvolvedores: máis de 8,5 millóns de programadores utilizan mensualmente os modelos Gemini, mentres centos de clientes de Google Cloud xa procesan máis dun billón de tokens cada un.
A Busca continúa a ser o principal escaparate tecnolóxico da compañÃa. O chamado Modo IA supera xa os mil millóns de usuarios activos mensuais, mentres as Vistas Creadas con IA alcanzan os 2.500 millóns. Google considera que o buscador está a transformarse nun sistema conversacional permanente, no que as respostas deixan de ser simples listaxes de ligazóns para ofrecer experiencias dinámicas e personalizadas.
A aplicación Gemini tamén experimentou un forte crecemento, pasando de 400 a máis de 900 millóns de usuarios activos mensuais nun ano. Entre as novidades máis destacadas figura Gemini Spark, un novo axente persoal persistente capaz de actuar en segundo plano sobre tarefas prolongadas. Este sistema poderá integrarse con ferramentas propias de Google e tamén con servizos de terceiros mediante MCP. Spark funcionará tanto na aplicación Gemini como posteriormente en Chrome, onde actuará como un navegador axéntico capaz de executar accións directamente na web.
Google tamén presentou unha nova xeración de experiencias conversacionais integradas nos seus produtos. Pregunta a YouTube permitirá formular consultas complexas en linguaxe natural e acceder directamente aos fragmentos relevantes dos vÃdeos. Pola súa banda, Documentos Live transformará a creación de documentos mediante control por voz, permitindo ditar, editar e estruturar contidos oralmente sen empregar o teclado.
Google anunciou tamén a oitava xeración das súas TPU, dividida en dous chips especializados: TPU 8t para adestramento de modelos e TPU 8i para inferencia. A compañÃa asegura que o novo sistema permite distribuÃr o adestramento entre máis dun millón de TPU repartidas globalmente, reducindo drasticamente os tempos necesarios para desenvolver modelos de gran tamaño. Google prevé investir arredor de 190.000 millóns de dólares en infraestrutura este ano, fronte aos 31.000 millóns de 2022.
Outro dos anuncios centrais foi Gemini Omni, un modelo multimodal capaz de xerar vÃdeo, e posteriormente tamén imaxes e texto, a partir de calquera tipo de entrada. A primeira versión comercial será Gemini Omni Flash, xa dispoñible na aplicación Gemini, Google Flow e YouTube Shorts. Este sistema combina as capacidades lingüÃsticas de Gemini cos modelos multimedia desenvolvidos por Google.
A transparencia do contido xerado por IA tamén tivo protagonismo no evento. Google ampliará o uso de SynthID, o seu sistema de marca de auga invisible, que xa se utilizou para etiquetar máis de 100.000 millóns de imaxes e vÃdeos. Ademais, OpenAI, Kakao e Eleven Labs incorporaranse como socios da tecnoloxÃa. Google tamén integrará as Credenciais de Contido en Busca e Chrome para facilitar a identificación de materiais creados ou modificados mediante IA.
No ámbito dos modelos de IA, Gemini 3.5 Flash converteuse nun dos principais protagonistas. Google presume de que supera en numerosos indicadores ao anterior Gemini 3.1 Pro, cun rendemento especialmente destacado en programación e tarefas axénticas. Afirman que o novo modelo ofrece velocidades de xeración moi superiores ás doutros modelos avanzados do mercado, mantendo custos significativamente máis baixos.
A plataforma Antigravity evoluciona paralelamente cara a un sistema de coordinación de axentes autónomos. A nova versión Antigravity 2.0 incorpora unha aplicación independente para escritorio desde a que organizar e supervisar múltiples axentes de IA. Google asegura que determinadas versións optimizadas poden ser ata doce veces máis rápidas ca outros modelos de referencia.
A integración da IA esténdese tamén ao ecosistema Android. O novo espazo Android Halo permitirá supervisar en tempo real o estado das tarefas executadas polos axentes de Gemini.
Google Flow recibiu novas capacidades centradas na creación multimedia mediante axentes especializados, mentres Google Pics se presenta como unha ferramenta avanzada de edición de imaxes baseada no modelo Nano Banana, capaz de tratar os distintos elementos dunha escena como obxectos independentes editables.
A investigación cientÃfica tamén entra na folla de ruta da IA axéntica con Gemini for Science, unha plataforma que combina ferramentas de razoamento profundo, acceso a bases de datos cientÃficas e integración con Antigravity para acelerar tarefas de investigación en ciencias biolóxicas.
O discurso de Google en I/O 2026 deixa clara unha orientación estratéxica: a compañÃa pretende que Gemini deixe de ser un simple asistente conversacional para converterse nunha infraestrutura transversal capaz de actuar de maneira autónoma sobre produtos, servizos e fluxos de traballo completos.
VÃdeo da presentación inaugural de Google I/O 2026
