La inteligencia artificial sigue transformando la manera en que interactuamos con nuestras herramientas digitales. Una de las innovaciones más recientes es la capacidad de Gemini, el asistente de Google, para analizar documentos PDF en tu pantalla y responder preguntas sobre ellos de forma inmediata.
Gemini detecta cuándo un PDF está en tu pantalla
La aplicación Files by Google ha integrado una función que permite a Gemini reconocer automáticamente cuando estás visualizando un archivo PDF en tu dispositivo. Una vez que esta característica está activa, puedes utilizar el asistente para interactuar directamente con el contenido del documento.
Sin embargo, es importante mencionar que esta funcionalidad está disponible exclusivamente para los suscriptores de Gemini Advanced, una versión premium del servicio. Desde su implementación inicial, esta herramienta ha comenzado a desplegarse de manera gradual, ofreciendo a los usuarios una experiencia más intuitiva y personalizada.
Cómo funciona la función de preguntas sobre PDFs
El proceso para utilizar esta característica es sencillo. Mientras visualizas un PDF en la aplicación Files, puedes activar Gemini y observar un botón llamado “Ask about this PDF” (“Preguntar sobre este PDF”).
Al presionar este botón, tienes la posibilidad de realizar preguntas relacionadas con el contenido del archivo, similar a cómo funciona ChatGPT con documentos en formato PDF.
Esta herramienta es especialmente útil para extraer información específica sin necesidad de leer todo el documento, optimizando tiempo y esfuerzo. Su introducción fue anunciada inicialmente en la conferencia de desarrolladores I/O de Google en mayo.
Otras funciones contextuales de Gemini
Gemini también destaca por sus capacidades más allá de los PDFs. Este asistente también puede responder preguntas sobre páginas web y videos de YouTube, haciendo uso de su tecnología de reconocimiento contextual.
En los casos donde un archivo o aplicación no cuente con soporte específico, Gemini ofrece una alternativa práctica: captura una imagen de tu pantalla cuando seleccionas la opción “Ask about this screen” (“Preguntar sobre esta pantalla”) y utiliza esa captura para proporcionar respuestas relevantes.
La capacidad de Gemini para analizar documentos PDF y otros contenidos de pantalla representa un avance significativo en la integración de inteligencia artificial en nuestra vida diaria.
Vía The Verge