Google amplía las funciones de Gemini Live: cámara en tiempo real y pantalla compartida para todos los Android compatibles

Última actualización:
Autor:

Interfaz de Gemini Live con cámara en tiempo real

Gemini Live, la plataforma de inteligencia artificial conversacional de Google, da un salto importante con la activación de nuevas funciones visuales que transforman la forma en la que los usuarios pueden interactuar con su móvil. A través de la integración con Project Astra, ahora es posible utilizar la cámara y compartir pantalla para generar respuestas más contextuales y precisas desde el asistente. Si te interesa profundizar sobre este proyecto puedes visitar Google Project Astra.

Estas novedades ya se han comenzado a desplegar de manera progresiva y están disponibles para los usuarios que cuenten con una suscripción activa al plan Google One AI Premium, lo que permite acceder a Gemini Advanced. Esta avanzada versión del asistente añade análisis en tiempo real de lo que capta la cámara o se visualiza en la pantalla, lo que amplía las posibilidades de uso muy por encima de lo que se había ofrecido hasta ahora por parte de la compañía.

Funciones visuales de Gemini Live: cómo funcionan y qué ofrecen

Uso de cámara en Gemini Live

Una de las funciones más destacadas es el análisis visual mediante la cámara del dispositivo. Al activar Gemini Live, el usuario puede enfocar cualquier objeto, lugar o situación con la cámara del móvil y formular preguntas directamente al asistente. En tiempo real, Gemini procesa lo que ve y responde en consecuencia, ya sea identificando un objeto, sugiriendo una acción o proporcionando información contextual.

La segunda gran función integrada es la capacidad de leer la pantalla en tiempo real. Si estás viendo un documento, imagen o sitio web, Gemini puede analizar lo que está a la vista y ayudarte a entenderlo, traducirlo o resumirlo sin que tengas que copiar o pegar nada. Todo surge de la visualización directa de tu pantalla y las preguntas que formules, ya sea por voz o texto. Para explorar más sobre las funciones detalladas, visita Funciones de Gemini en Android.

Estas herramientas están diseñadas para facilitar interacciones naturales con la tecnología, convirtiendo al asistente en un aliado más intuitivo y eficaz para tareas del día a día, desde interpretar gráficos hasta explicarte contenidos complejos o ayudarte a elegir el color apropiado para un objeto que estás enfocando con la cámara.

  ¿Se puede utilizar Ms Office 2010 en Windows 10?
gemini live-0
Artículo relacionado:
Gemini Live: así será la integración de la IA en Android Auto y otros dispositivos

Compatibilidad, requisitos y detalles sobre el despliegue

Gemini Live en dispositivo Android

Las nuevas funciones no están reservadas solo para dispositivos Pixel o Galaxy, a pesar de que inicialmente se pensó que serían exclusivas de esos modelos. Google ha confirmado que cualquier dispositivo Android con soporte para Gemini Advanced puede optar a estas capacidades, siempre que tenga instalada la versión correcta del software y cumpla con los requisitos mínimos del sistema.

Con que el dispositivo cuente con Android 10 o superior, en teoría ya sería compatible. Además, se admiten modelos plegables y tablets, ampliando considerablemente la base de usuarios con acceso.

El despliegue es progresivo, por lo que no todos los usuarios lo verán inmediatamente. Google ha afirmado que seguirá extendiendo la disponibilidad en las próximas semanas, y que cualquier cambio o novedad se anunciará a través de los canales oficiales de la compañía, como su cuenta de Twitter @GeminiApp.

gemini live
Artículo relacionado:
Google lanza Gemini Live en español: conversaciones fluidas y naturales con IA

Gemini y Project Astra: la tecnología detrás del cambio

Tecnología de Project Astra en Gemini

Todo este avance ha sido posible gracias a la tecnología desarrollada en Project Astra. Este proyecto permite dotar al asistente de una comprensión visual que simula la percepción humana. Al poder “ver” lo que acontece en la cámara o en la pantalla, el asistente genera respuestas más contextuales, precisas y útiles. No se trata solo de acciones automatizadas predeterminadas, sino de análisis en tiempo real con capacidad de interpretación sofisticada.

Además, Astra potencia elementos como la interacción multimodal y la voz, permitiendo mantener una conversación fluida mientras se analiza contenido visual. Esto significa que puedes hablar con Gemini mientras le muestras una imagen o exploras un archivo, y el asistente responderá con base en lo que ve, combinando audio, texto e imagen como referencia.

Esta aproximación cambia radicalmente la forma en la que interactuamos con la inteligencia artificial, haciendo que la experiencia se sienta más cercana y con mayor utilidad práctica, sobre todo en contextos como la educación, diseño, compras u organización personal.

  Google prepara el lanzamiento de la App independiente de Gemini en iOS con funciones avanzadas de IA conversacional
instalar skills Alexa para usar ChatGPT y Gemini-7
Artículo relacionado:
Cómo instalar skills de Alexa para usar ChatGPT y Gemini

Ventajas del plan Google One AI Premium

Google One AI Premium con Gemini

Para poder acceder a todas estas funciones es necesario contar con una suscripción activa a Google One AI Premium. Este plan, que tiene un coste mensual aproximado de 21,99 euros, ofrece no solo acceso a Gemini Advanced con todas sus herramientas completas, sino también 2 TB de almacenamiento en la nube, integración avanzada con aplicaciones como Gmail y Documentos y mejoras en asistencia para redacción, planificación y organización.

El paquete se enfoca en usuarios que buscan aprovechar al máximo el potencial de la inteligencia artificial dentro del ecosistema Google, y esta expansión de Gemini Live refuerza ese enfoque. No obstante, la necesidad de una suscripción deja fuera a quienes no quieran o puedan asumir este coste, lo que podría limitar la llegada masiva de estas funciones, al menos por ahora.

gemini app independiente ios-0
Artículo relacionado:
Google prepara el lanzamiento de la App independiente de Gemini en iOS con funciones avanzadas de IA conversacional

Preguntas sobre privacidad y rendimiento

Privacidad en uso de cámara con inteligencia artificial

El hecho de que Gemini pueda acceder a la cámara o pantalla en tiempo real también ha encendido ciertas alarmas en cuanto a la privacidad. Aunque Google ha asegurado que lo que ve el asistente no se almacena ni se comparte, y que todo ocurre en el momento, aún existen dudas sobre cómo se trata la información y cuáles son los límites reales del análisis de datos.

Otro factor que está en debate es el impacto en el rendimiento general del dispositivo. Mantener la cámara o la grabación de pantalla activa por largos periodos puede suponer un consumo adicional de batería y procesador, lo que se notaría especialmente en dispositivos de gama media o baja.

Además, el buen funcionamiento de estas herramientas está ligado a la disponibilidad de una conexión a internet estable. En lugares con conectividad deficiente, las respuestas podrían llegar con cierto retraso o directamente no ejecutarse correctamente, lo que limita el uso en ciertas regiones.

  ¿Cómo puedes utilizar Amazon Smile para Android?
historia de las redes sociales antes de facebook-2
Artículo relacionado:
Historia de las redes sociales antes de Facebook: los pioneros olvidados

A pesar de eso, la experiencia compartida por los primeros usuarios sugiere que las funciones resultan prácticas y bien integradas. Casos como el análisis de una planta para saber si necesita más luz, o pedir consejo sobre el color ideal para un objeto artesanal, son solo algunas de las formas en las que los usuarios han empezado a utilizar esta tecnología de forma cotidiana.

Con la llegada de estas nuevas funciones, Gemini Live se consolida como una apuesta potente de Google por integrar la inteligencia artificial en la vida diaria. Desde la interpretación visual hasta la búsqueda contextual completamente automatizada, estas herramientas abren una nueva etapa en la relación entre usuarios y dispositivos, aunque también invitan a una reflexión detenida sobre su alcance, privacidad y sostenibilidad técnica.

Deja un comentario