Revisión a fondo de BrowserOS: el navegador con agentes de IA y privacidad real

Última actualización: 22/05/2026
Autor: Isaac
  • BrowserOS es un fork de Chromium con agentes de IA nativos que automatizan clics, formularios y navegación desde tu propio equipo.
  • El proyecto es open source (AGPL-3.0), prioriza la privacidad, soporta modelos locales y permite usar tus propias claves de IA.
  • Integra servidor MCP, Workflows visuales, tareas programadas y decenas de integraciones con apps como Gmail, Notion o Salesforce.
  • Se posiciona como alternativa real a Atlas, Comet o Dia al combinar automatización profunda, compatibilidad con extensiones y control de datos.

Revision BrowserOS

Si has empezado a oír hablar de BrowserOS como “navegador con cerebro” y no terminas de ver qué lo hace distinto de Atlas, Comet o el propio Chrome con Copilot, estás en el sitio adecuado. En las últimas semanas se ha convertido en uno de los proyectos más comentados entre quienes buscan navegadores menos conocidos, con funciones de automatización real y, sobre todo, con la privacidad como prioridad.

La idea central de BrowserOS es sencilla de explicar, pero potente en sus consecuencias: tú describes en lenguaje natural lo que quieres que pase en el navegador y un agente de IA se encarga de hacer clic, escribir y navegar por ti, directamente desde tu equipo. Nada de agentes en nubes ajenas viendo tu sesión a distancia: aquí el motor vive dentro de un fork de Chromium, es software libre y apuesta por modelos locales y por “trae tus propias claves” para que tus datos no tengan que viajar a ningún lado si no quieres.

Qué es exactamente BrowserOS y qué lo hace diferente

Que es BrowserOS

BrowserOS es, en esencia, un navegador basado en Chromium que integra de forma nativa agentes de inteligencia artificial. No estamos hablando de una extensión, ni de un chatbot al margen, sino de un sistema donde el propio navegador entiende instrucciones en lenguaje natural y puede ejecutar secuencias de acciones: abrir páginas, iniciar sesión, hacer búsquedas, rellenar formularios, extraer y transformar información o lanzar flujos complejos combinando web y archivos locales.

Al partir de Chromium, el entorno resulta muy familiar desde el primer minuto: interfaz parecida a Google Chrome, compatibilidad con casi todas tus extensiones, posibilidad de importar marcadores, contraseñas e historial de Chrome y, en general, cero curva de aprendizaje si ya estás acostumbrado al ecosistema. Para quien viene de Chrome, Brave o Edge, la sensación es “se siente como en casa, pero con superpoderes”.

La diferencia clave es que los agentes viven dentro del navegador y se ejecutan en tu máquina. No es un servicio remoto que “mira” lo que haces para luego simular clics desde un servidor; BrowserOS levanta un servidor de herramientas de automatización (expuesto como servidor MCP) que controla su propio Chromium modificado. Sobre él, una capa de agente IA en TypeScript/Go se comunica con el navegador vía Chrome DevTools Protocol, con bindings tipados y todo el arsenal necesario para moverse por la web como una persona.

El proyecto se organiza como un monorepo con dos grandes bloques: el fork de Chromium por un lado, y la plataforma de agentes por otro. Dentro están el navegador en sí (C++/Python y build system), el servidor Bun con más de 50 herramientas MCP para automatizar tareas, la extensión interna de agente (nueva pestaña, panel lateral, ajustes), el CLI en Go para controlarlo desde terminal o desde agentes de código tipo Claude Code, y un framework de evaluación para medir rendimiento en benchmarks como WebVoyager o Mind2Web.

Todo esto se publica bajo licencia AGPL-3.0, con el código abierto a revisión y modificación siempre que se respeten las condiciones de la licencia. Y, algo que muchos valoran: los prompts del sistema y la lógica de agente no son una caja negra; se documentan y se pueden ajustar desde el propio proyecto (por ejemplo, mediante el archivo SOUL.md, que define la personalidad y reglas del asistente).

Por qué ahora: el auge de los navegadores agénticos

En muy poco tiempo hemos pasado de tener un simple navegador que muestra páginas a una oleada de “browsers con IA” que prometen hacer el trabajo por ti. Ahí tenemos ChatGPT Atlas, Perplexity Comet, Dia (heredero espiritual de Arc bajo Atlassian), propuestas visuales como Kosmik, inventos más marketinianos como Fellou, o soluciones con más sombras que luces como Sigma.

La mayoría comparten patrón: basados en Chromium, con un panel lateral donde vive el asistente, funciones de resumen de páginas, búsqueda avanzada, algo de automatización de pestañas y, en muchos casos, un modelo de negocio apoyado en la recolección de datos para publicidad o en suscripciones cerradas a un LLM concreto. Son cómodos, sí, pero difícilmente encajan en entornos donde la privacidad y el control de datos son críticos.

El equipo de BrowserOS parte de otro diagnóstico: millones de trabajadores del conocimiento pasan el 60-80% del tiempo en apps web, pero siguen atrapados en tareas mecánicas de navegador: copiar y pegar datos, rellenar una y otra vez los mismos formularios, mover información de un SaaS a otro, preparar informes desde paneles sin API, etc. Las herramientas de IA ya ayudan programando, escribiendo y analizando, pero casi ninguna entra a fondo en “pulsar botones en la interfaz” de forma fiable y, sobre todo, segura.

Ahí es donde entra la noción de navegador agéntico: convertir el navegador en un “sistema operativo de agentes” que puedan actuar en cualquier web, con tus sesiones autenticadas, sin obligarte a enseñar tus credenciales a un proveedor remoto. Justamente lo que BrowserOS intenta hacer al ejecutar los agentes localmente y orquestar las acciones desde ahí.

Problemas que intenta resolver BrowserOS

Antes de que apareciera BrowserOS, muchas propuestas de automatización con IA se chocaban con tres barreras muy concretas. La primera era el acceso a sesiones autenticadas reales: si el agente corre en un servidor remoto, suele tener serias dificultades para operar con tus cuentas de Gmail, LinkedIn, herramientas corporativas o intranets sin meterse en terrenos pantanosos de seguridad.

La segunda barrera es la fragmentación extrema de herramientas y protocolos. Un sistema te permite hablar con servidores MCP, otro solo automatiza la UI del navegador, otro se centra en flujos de APIs tipo Zapier… y al final acabas con una colección de piezas inconexas que no resuelven de punta a punta los procesos que tienes en el día a día.

  Cómo compartir conversaciones con enlaces en los principales chatbots

La tercera es el modelo de producto: caja negra, cierre y prioridad a la publicidad o a la búsqueda. Es el caso de navegadores que centran su negocio en monetizar las consultas de los usuarios, o en dirigir tráfico a su motor de búsqueda. No te abren el código, no te dejan ver los prompts, te fuerzan a usar su modelo y se quedan con tus datos de uso para mejorar su servicio… y su cuenta de resultados.

BrowserOS responde a este triple problema con un enfoque bastante directo: agentes dentro de tu navegador, corriendo en tu ordenador, combinando automatización de navegador y MCP, con filosofía open source y control local. Tú eliges qué LLM usar, qué datos salen de la máquina y qué se queda en casa; y encima puedes auditar el código para ver cómo se comporta el agente.

Arquitectura y componentes de BrowserOS

Internamente, BrowserOS se organiza como un monorepo con dos grandes subsistemas: el propio navegador (fork de Chromium) y la plataforma de agentes. El paquete packages/browseros contiene el código del navegador, los parches de privacidad (inspirados en parte en ungoogled-chromium), el sistema de build y la firma para cada plataforma. Es la parte más dura en C++ y Python, que requiere del orden de 100 GB de espacio para compilar si decides construirlo tú mismo.

En paralelo, apps/server es un servidor Bun que expone más de 50 herramientas MCP y que ejecuta el bucle principal del agente. Es aquí donde se definen las capacidades de automatización: navegación, clic, scroll, extracción estructurada de datos, interacción con formularios, lectura de tablas, etc. Todo ello expuesto como herramientas MCP que el LLM invoca según la tarea.

Luego está apps/agent, que actúa como extensión interna: proporciona la nueva pestaña, el panel lateral de chat, el sistema de onboarding y el menú de configuración para agentes y proveedores de IA. Desde ahí abres el chat, seleccionas modelos, ajustas memoria, defines Skills (conjuntos de instrucciones preconfiguradas) y gestionas Workflows (flujos visuales de automatización reutilizables).

La pieza apps/cli ofrece un CLI en Go llamado browseros-cli, pensado para controlar el navegador desde el terminal o desde agentes de código como Claude Code. Puedes lanzar BrowserOS, inicializar la conexión con un comando init y, a partir de ahí, mandar tareas al agente desde scripts, pipelines de CI o entornos de desarrollo con soporte MCP.

Por último, apps/eval y el paquete agent-sdk proporcionan el marco para evaluar y desarrollar agentes: se incluyen bancos de pruebas como WebVoyager o Mind2Web, SDK en Node.js para automatizar el navegador con lenguaje natural, y bindings tipados para el protocolo Chrome DevTools (cdp-protocol), clave para que el agente pueda interactuar de forma segura y fiable con las páginas.

Funciones clave en el uso diario

Desde el punto de vista del usuario, lo interesante es cómo todo esto se traduce en funciones concretas. Uno de los pilares es el Agente de IA integrado, que dispone de más de 50 herramientas de automatización del navegador: puede abrir nuevas pestañas, navegar a URLs, seguir enlaces, hacer scroll, rellenar formularios, pulsar botones, leer tablas y listas, o extraer datos relevantes de forma estructurada.

Aquí entra en juego el sistema de Workflows, un constructor visual de flujos que permite montar automatizaciones repetibles: por ejemplo, una receta para ir cada mañana a cierto dashboard, extraer datos y volcarlos en un fichero local o en un SaaS conectado vía MCP. Estos flujos tienen soporte de tareas programadas (Scheduled Tasks), de modo que puedes hacer que se ejecuten cada día, hora o incluso cada pocos minutos.

La función Cowork combina automatización de navegador con operaciones sobre archivos locales. Esto permite, por ejemplo, que el agente investigue en la web, genere un informe en un documento Markdown o en un PDF y lo guarde automáticamente en una carpeta de tu sistema. Es un paso claro hacia ese modelo de “agente-empleado” que hace trabajo pesado mientras tú te centras en decidir qué quieres obtener.

BrowserOS incorpora además un sistema de Memoria persistente entre conversaciones, de manera que tu asistente puede recordar contexto a largo plazo: proyectos que tienes en marcha, preferencias sobre cómo redactar, reglas internas, etc. Ese comportamiento se ajusta mediante el archivo SOUL.md, donde defines personalidad, tono y pautas de actuación del agente, algo útil si quieres alinearlo con las políticas de tu empresa.

A nivel de gestión de la interfaz, el navegador incorpora pestañas verticales (Vertical Tabs) para facilitar el manejo del decenas o cientos de pestañas, un buscador semántico de historial y marcadores (busca por significado, no solo por texto literal), un sistema de subrayado integrado para no perder fragmentos clave de la investigación, Smart Nudges que sugieren integraciones o herramientas adecuadas según el contexto, y la posibilidad de definir Skills específicos: conjuntos de instrucciones curadas que moldean cómo debe comportarse el agente frente a cierto tipo de tarea.

Privacidad por delante: modelos locales y llaves propias

Uno de los grandes atractivos de BrowserOS es que no te encadena a un único proveedor de IA. El navegador funciona con cualquier LLM moderno: puedes usar tus propias claves de OpenAI (GPT‑4o, o3), Anthropic (Claude), Google (Gemini), Azure OpenAI, AWS Bedrock, Qwen Code, Kimi K2.5, GitHub Copilot, o conectarte a agregadores como OpenRouter. Y, si lo prefieres, ejecutar modelos locales con Ollama o LM Studio, de forma que las peticiones nunca salgan de tu equipo.

La tabla de compatibilidad deja claro que BrowserOS apuesta por el modelo “bring your own keys”: nada de pago obligatorio a un modelo integrado si tú ya estás suscrito a ChatGPT Pro, Plus o GitHub Copilot. La versión 0.44.0, de hecho, introduce soporte para aprovechar directamente esas suscripciones como backend de los agentes del navegador, sin sobrecostes por parte de BrowserOS.

Para quienes vienen de otras propuestas, la comparación es bastante contundente: frente a Chrome o Brave, BrowserOS ofrece AI Agent, servidor MCP local, Workflows visuales, Cowork, tareas programadas, uso de llaves propias, modelos locales, enfoque local-first en privacidad y bloqueo de anuncios con soporte Manifest V2 (uBlock Origin incluido), todo ello en un proyecto abierto. En la tabla comparativa, Chrome, Brave, Atlas, Comet o Dia van marcando muchos “no” donde BrowserOS marca “sí”.

La filosofía es, en resumen, que tu historial de navegación, tus sesiones autenticadas y los datos que manipulan los agentes se queden en tu máquina. Si quieres que algo salga, se hace vía la llave del proveedor que tú decidas, con la posibilidad adicional de cerrar completamente el grifo y quedarte solo con modelos locales. Esto contrasta, por ejemplo, con navegadores como Perplexity Comet, cuyo CEO ha reconocido la intención de registrar todo lo que haces en el navegador para nutrir un sistema de anuncios hiperpersionalizados.

  ChatGPT integra por fin el modo voz en el propio chat

Integraciones MCP, aplicaciones conectadas y uso desde otros agentes

Un punto especialmente potente es el papel de BrowserOS como servidor MCP (Model Context Protocol). Esto significa que el propio navegador puede exponerse como un conjunto de herramientas a otros clientes MCP, como claude-code, gemini-cli o cualquier agente compatible que quieras montar. En la práctica, tu editor de código o tu terminal pueden delegar acciones de navegador en BrowserOS sin que tú tengas que tocar el ratón.

En el lado de las integraciones, el navegador viene ya con soporte para Gmail, Google Calendar, Google Docs, Google Sheets, Notion, Slack, GitHub, Linear, Figma, Salesforce y muchas más vía servidores MCP. Muchas de estas integraciones se instalan con un solo clic y permiten hacer cosas como generar borradores de respuestas, programar reuniones, actualizar issues de GitHub o mover tareas en Linear como parte de un flujo más grande.

Lo interesante es que no tienes que elegir entre “automatizar el navegador” o “hablar con APIs vía MCP”. BrowserOS permite mezclar ambas capas en una misma receta de agente: puedes raspar datos de un portal web sin API, procesarlos con un modelo y acto seguido actualizarlos en una hoja de cálculo o en un CRM mediante la integración MCP correspondiente, todo en un solo flujo coherente.

Esta capacidad de orquestación se extiende al CLI: usando browseros-cli en macOS, Linux o Windows, es posible lanzar y controlar tareas de navegador desde scripts, pipelines de CI/CD o agentes de desarrollo. Tras conectar el CLI a una instancia de BrowserOS con el comando init, cualquier herramienta externa puede disparar automatizaciones completas en el navegador, beneficiándose de las sesiones autenticadas y del contexto real del usuario.

Funciones destacadas de la versión 0.44.0

Entre las novedades recientes, la versión 0.44.0 de BrowserOS trae varias mejoras interesantes. La más vistosa es el soporte directo para ChatGPT Pro/Plus y GitHub Copilot como proveedores de IA para los agentes: si ya estás pagando estas suscripciones, puedes emplearlas para automatizar tareas en el navegador sin pagar dos veces por lo mismo, simplemente iniciando sesión con tus cuentas.

Otra incorporación práctica es la entrada por voz en la barra de chat. En lugar de escribir cada consulta, puedes hablarle al agente para que interprete la orden y ejecute la secuencia correspondiente. Esto se agradece especialmente en tareas largas o cuando estás encadenando varias órdenes de forma fluida.

A nivel de comportamiento, se ha rehecho parte del sistema de grounding del agente para que las acciones sobre el navegador sean más fiables y precisas. Es decir, menos clics “al aire”, más acierto sobre los elementos correctos y mejor gestión de estados complejos en páginas dinámicas.

La versión también incluye correcciones varias: mejoras en las herramientas de memoria, arreglos en el “fill tool” para completar campos de forma más consistente, ajustes en el diseño de la nueva pestaña y un buen puñado de refinamientos de estabilidad que se notan en sesiones largas de automatización.

Casos de uso reales: del scraping inteligente al “empleado-agente”

Donde BrowserOS enseña de verdad los dientes es cuando se le plantean tareas completas de trabajo, no simples preguntas. Imagina que quieres tener cada mañana, a las siete, un informe con las últimas novedades en inteligencia artificial: papers de arXiv, repositorios de Hugging Face, menciones en Google Scholar, noticias de la industria, posts de blogs relevantes, notas de gobiernos, movimientos de acciones de empresas de IA…

Con BrowserOS puedes definir un Scheduled Task que ejecute ese flujo: el agente abre las fuentes pertinentes, busca las novedades desde la última ejecución, extrae titulares y enlaces clave, los agrupa y los vierte en un documento o en una hoja de cálculo. La primera vez conviene supervisar y ajustar prompts para afinar la selección, pero una vez está afinado se convierte en una especie de “empleado digital” que hace esa ronda de vigilancia por ti.

Otro ejemplo práctico es el procesamiento de formularios y paneles internos sin API. Muchas empresas todavía dependen de aplicaciones web heredadas donde no hay endpoints públicos; lo único que hay es una interfaz pensada para que alguien haga clic. Aquí el agente de BrowserOS puede navegar por esos menús, rellenar los campos, pulsar los botones y extraer las confirmaciones, igual que lo haría una persona, pero con una receta reutilizable y auditada.

También es útil en la preparación rápida de reuniones o campañas. Puedes pedirle al agente que revise las últimas conversaciones relevantes en Gmail, mensajes de Slack y documentos de Google Docs asociados a un proyecto, que cruce esa información con datos de Salesforce o Notion y genere un briefing compacto. Todo ello se hace combinando las integraciones MCP y la automatización del navegador para acceder a páginas o paneles que no estén totalmente integrados.

En el ámbito de investigación, demos como hackernews.top.3.mp4, use-browserOS-to-chat.mp4 o use-browserOS-to-extract.mp4 muestran al agente navegando por sitios como Hacker News, identificando los hilos más relevantes según criterios concretos, abriéndolos y extrayendo información útil, o chateando contigo a la vez que se mueve por la web. Es la idea de “hablar con la web” llevada a la práctica con acciones visibles.

Experiencia de usuario, puntos fuertes y aspectos a pulir

Una de las cosas que más se repite en las reseñas es que BrowserOS no intenta reinventar la rueda en la interfaz básica. Te recibe con una barra de direcciones clásica, pestañas donde esperas encontrarlas y un acceso rápido al panel de IA, de modo que no tienes que “aprender un navegador nuevo desde cero”. Para usuarios que ya han saltado entre Arc, Dia, Wavebox o experimentos más exóticos, se agradece esta sobriedad.

El panel de chat soporta varios proveedores de IA desde el minuto cero y permite usar tus cuentas de ChatGPT, Claude, Gemini, Grok o Perplexity como backend. Esto va en contra del patrón de muchos navegadores “con IA” que intentan colocarte su propio modelo o su suscripción. Aquí, si ya estás pagando por ChatGPT Pro o Copilot, lo aprovechas; si prefieres ir por libre con Ollama, también puedes.

  Campos receptivos en redes neuronales convolucionales (CNN)

El LLM Hub es una función curiosa que permite comparar entre varios modelos en paralelo en una misma página. Aunque pueda parecer una excentricidad, resulta útil para ver diferencias de razonamiento o estilo entre modelos, o para validar respuestas cruzando varias fuentes. El propio equipo lo define a veces con humor como “Clash of the GPTs”.

No todo es perfecto, claro. Algunos usuarios han señalado que echan de menos un sistema de importación más completo desde otros navegadores, especialmente para quien viene de Edge con años de favoritos, contraseñas y ajustes. También se menciona que el panel de IA no siempre es tan “consciente del contexto” como en otros productos más maduros; se han añadido funciones de captura de pantalla y copia de contenido para paliar esto, pero sigue siendo un área a mejorar.

Aun así, para tratarse de un proyecto relativamente joven, la velocidad de iteración es alta y la comunidad en Discord y GitHub está muy activa: hay contribuciones de terceros, peticiones de nuevas funciones, pull requests y debates abiertos sobre cómo debe evolucionar la interfaz, la integración con modelos locales y el sistema de memoria.

Comparativa rápida con otros navegadores con IA

Vista la panorámica general, merece la pena situar BrowserOS frente a algunos de sus rivales más sonados. Frente a ChatGPT Atlas, que es básicamente un Chrome modificado con un panel de ChatGPT encajado y funciones de agente orientadas a búsquedas y compras, BrowserOS apuesta por el open source, por correr el cerebro en tu equipo y por no encerrar el acceso a modelos detrás de un solo proveedor.

Comparado con Perplexity Comet, que brilla como navegador de investigación y recuperación de conocimiento (con citas bien enlazadas y proyectos colaborativos), BrowserOS sacrifica parte de esa capa social y editorial en favor de automatización profunda de la interfaz y control local de datos. Además, donde Comet asume un modelo de negocio ligado a la publicidad y el perfilado de uso, BrowserOS rehúye esa vía por diseño.

Frente a Dia (ex Arc, bajo Atlassian), que centra su discurso en personalización, memoria del usuario, Skills y un diseño muy pulido pero con un enfoque más cerrado y orientado al ecosistema Atlassian, BrowserOS ofrece una alternativa abierta, multiplataforma (Windows, macOS, Linux) y menos dependiente de un proveedor único o de integraciones con productos corporativos concretos.

Si lo comparamos con propuestas más “de nicho” como Fellou, Sigma o Kosmik, la diferencia vuelve a estar en el foco: mientras algunos de estos navegadores apuestan por experiencias visuales espectaculares, marketing agresivo o promesas de autonomía total que luego no terminan de cumplirse, BrowserOS prefiere centrarse en que el agente realmente navegue, haga clic donde debe, llene formularios y respete tu privacidad, sin convertirte en el producto.

En el extremo opuesto están soluciones como Edge con Copilot, que llevan tiempo ofreciendo un asistente en el navegador, pero en la práctica se quedan en un chat con IA y alguna que otra función de resumen o generación de imágenes. Son útiles, sobre todo si ya pagas por Copilot en el ecosistema Microsoft 365, pero no compiten todavía con el nivel de automatización de interfaz ni con la apertura de BrowserOS.

Instalación, plataformas y comunidad

Instalar BrowserOS no tiene mucha ciencia: hay builds para macOS, Windows y Linux, incluyendo formatos cómodos como AppImage y paquetes Debian en el caso de Linux. Desde la página oficial puedes descargar la versión correspondiente a tu sistema, ejecutar el instalador y tener el navegador listo en pocos minutos.

El proceso recomendado suele ser: descargar, instalar, importar datos de Chrome si quieres conservar marcadores, contraseñas y extensiones, conectar el proveedor de IA de tu elección (o configurar modelos locales con Ollama/LM Studio) y, a partir de ahí, empezar a describir tareas al agente. El resto es ir ajustando Skills, Workflows y tareas programadas en función de tu flujo de trabajo.

En cuanto a comunidad, el proyecto cuenta con varios miles de estrellas en GitHub, decenas de miles de descargas y una comunidad activa en Discord donde se discuten nuevas funciones, se resuelven dudas técnicas y se recogen ideas de usuarios avanzados. Hay también un canal de solicitudes de funcionalidades y un documento de contribución detallado para quien quiera meterse en faena, tanto en la parte de agentes (TypeScript/Go) como en el desarrollo del navegador (C++/Python).

Para quienes vienen de otros navegadores “raros” como Zen Browser, Wavebox, Ulaa, Ghost Browser o Thorium, BrowserOS se está empezando a posicionar como una alternativa menos conocida pero con mucho potencial, gracias a la combinación de IA nativa, base Chromium, compatibilidad con extensiones, automatización real, soporte para modelos locales y una postura clara en privacidad.

Con todo lo que hemos visto, BrowserOS se perfila como un navegador agéntico de código abierto que intenta ir más allá del simple “chat en el lateral”: integra un agente capaz de actuar en la web como tú, con tus sesiones reales, combina automatización de interfaz con integraciones MCP, permite usar tus propias suscripciones a LLMs o modelos locales, pone la privacidad en el centro y, a diferencia de muchas propuestas propietarias, enseña todas sus cartas en GitHub. Todavía tiene margen de mejora en usabilidad y contexto, pero la base técnica y la filosofía que lo impulsa lo convierten en una opción muy seria para quien quiera que el navegador deje de ser solo un rectángulo donde miras páginas y pase a ser, de una vez, una herramienta que trabaja contigo y por ti.

perplexity comet-1
Related article:
Comet, el navegador de Perplexity: IA avanzada, nuevas funciones y polémica por la privacidad en su llegada a Windows