Tutorial básico de OSINT: guía completa para principiantes

Mundobytes » Informática » Ciberseguridad » Tutorial básico de OSINT para empezar con buen pie

OSINT permite transformar datos públicos dispersos en inteligencia útil mediante un método estructurado y legal.
Las fuentes abarcan desde webs, redes sociales y registros públicos hasta deep web, repositorios históricos y bases de datos de brechas.
Herramientas como Google Dorks, Shodan, Maltego o TheHarvester automatizan la recolección y el análisis de huella digital.
Una buena práctica OSINT combina técnica, pensamiento crítico y ética para evitar errores, sesgos y problemas legales.

Pasamos horas navegando entre noticias, redes sociales, documentos y vídeos, intentando separar lo relevante de lo irrelevante. En medio de ese océano de datos, tener un método y unas buenas herramientas marca la diferencia entre perder el tiempo o obtener información realmente útil.

Ahí es donde entra en juego OSINT, la inteligencia de fuentes abiertas. Más que una moda, es un conjunto de técnicas y procesos que permiten recopilar, analizar y transformar información pública en conocimiento accionable para ciberseguridad, periodismo, negocios o incluso búsqueda de personas.

Qué es OSINT y por qué importa tanto hoy

OSINT (Open Source Intelligence) es la disciplina que se centra en recolectar y analizar datos de fuentes públicas y accesibles de forma legal. Hablamos de todo lo que está disponible sin necesidad de saltarse contraseñas, vulnerar sistemas ni acceder a zonas restringidas: páginas web, redes sociales, blogs, foros, medios de comunicación, registros públicos, documentos, imágenes, vídeos y un largo etcétera.

Su objetivo no es acumular datos sin más, sino extraer conocimiento útil en función de un contexto concreto. Un analista OSINT no se limita a “buscar en Google”: define qué necesita saber, elige dónde buscar, qué herramientas emplear y cómo validar lo que encuentra para sostener decisiones informadas.

Los orígenes de OSINT están ligados al ámbito militar, policial y de inteligencia clásica, cuando ya se analizaban radios, periódicos o emisiones públicas para obtener ventaja estratégica. Con Internet, las redes sociales y el Internet de las Cosas, el volumen de datos se ha disparado y OSINT se ha vuelto imprescindible en ciberseguridad, investigaciones criminales, inteligencia empresarial o verificación de hechos.

En ciberseguridad, OSINT se usa tanto para evaluar el propio riesgo como para perfilar al adversario. Permite localizar dominios y subdominios expuestos, servicios mal configurados, credenciales filtradas, metadatos sensibles en documentos públicos o actividad sospechosa en foros y redes.

Pero la misma potencia que tienen los defensores, la tienen también los atacantes. Los ciberdelincuentes emplean OSINT para preparar campañas de spear phishing muy dirigidas, investigar a víctimas potenciales, localizar infraestructuras vulnerables o seguir conversaciones en foros oscuros para obtener información privilegiada.

Tipos de fuentes OSINT que deberías conocer

Las fuentes OSINT abarcan mucho más que “lo que sale en Google”. Entender qué tipos de fuentes existen ayuda a elegir mejor dónde buscar según la investigación.

Medios de comunicación tradicionales como televisión, radio y prensa siguen siendo una fuente muy valiosa. Proporcionan contexto, cronologías y versiones oficiales o semioficiales de los hechos, útiles para contrastar con otras fuentes abiertas.

Fuentes en línea visibles, es decir, la web “normal” indexada por buscadores, incluyen motores de búsqueda, blogs, foros, redes sociales, portales de noticias, wikis o directorios. Esta parte de la red suele ser el primer lugar al que recurre cualquier analista OSINT.

Deep web y dark web agrupan información que no está indexada por buscadores convencionales. Esto abarca desde paneles internos protegidos por login hasta foros clandestinos y marketplaces ilegales. Acceder a esta capa exige más cuidado, métodos y, sobre todo, un marco legal y ético muy claro.

Archivos históricos y repositorios como Wayback Machine o Archive.ph permiten consultar versiones antiguas de páginas web, recuperar contenido eliminado o ver cómo ha evolucionado un sitio con el tiempo. Son clave en investigaciones forenses digitales y análisis de cambios de infraestructura.

Bases de datos públicas y registros oficiales (registros mercantiles, catastro, boletines oficiales, portales de transparencia, bases de datos académicas) aportan información estructurada y, en general, más fiable, que se puede cruzar con fuentes menos formales como redes sociales.

Características clave de la OSINT bien hecha

Lo que hace potente a OSINT no son solo las herramientas, sino cómo se usa la información. Hay tres rasgos que definen una práctica profesional: legalidad, método y actualización constante.

Acceso público y marco legal

La esencia de OSINT es trabajar con datos accesibles sin vulnerar sistemas ni saltarse barreras de seguridad. Eso no significa que todo valga: seguir la ley y respetar la privacidad es obligatorio, especialmente cuando se manejan datos personales y al usar cámaras con reconocimiento facial.

Recolectar datos públicos es legal siempre que no se fuerce el acceso ni se superen los límites de uso de cada servicio. Aun así, correlacionar y publicar información personal de alguien sin justificación puede derivar en delitos como el doxxing, con consecuencias penales y reputacionales.

Tener en cuenta las políticas de privacidad y notificar fugas de datos sensibles a los responsables cuando sea posible forma parte de una práctica ética. OSINT no va de exponer a la gente, sino de reducir riesgos y ayudar a tomar mejores decisiones.

Método estructurado frente a improvisación

Uno de los mayores errores de los principiantes es lanzarse a buscar sin objetivos ni método. El resultado suele ser ruido, pérdida de tiempo y conclusiones débiles o directamente erróneas.

Solución definitiva: ¿Por qué mi impresora imprime símbolos raros o ilegibles?

Un flujo de trabajo OSINT sensato suele incluir varias fases encadenadas: definir objetivos, seleccionar fuentes, elegir técnicas y herramientas, recopilar datos (en modo pasivo, semi‑pasivo o activo), filtrar y analizar, y finalmente presentar resultados.

La recolección pasiva implica no interactuar directamente con el objetivo (consultar índices, cachés, registros públicos…). Es discreta y adecuada cuando no se quiere dejar rastro o levantar sospechas.

La obtención semi‑pasiva introduce un mínimo de interacción (consultas dirigidas, uso moderado de herramientas en tiempo real) intentando no revelar los verdaderos intereses del analista.

La obtención activa se basa en interactuar de forma abierta con el objetivo (formularios, correos, llamadas, pruebas directas sobre servicios, etc.). Suele ofrecer más información, pero revela claramente que alguien está investigando.

Actualización constante de fuentes y técnicas

Internet cambia a una velocidad que obliga a los analistas OSINT a estar siempre al día. Perfiles que ayer estaban abiertos hoy son privados o han sido borrados; servicios relevantes desaparecen y otros nuevos aparecen con fuerza.

Una fuente fiable puede volverse inexacta por cambios en la API, políticas internas o incluso por manipulación. Por eso, conviene contrastar periódicamente, revisar procedimientos y no dar por eterna la validez de una herramienta o portal.

El auge de la inteligencia artificial y de los agentes de IA colaborativos, las automatizaciones y las nuevas plataformas sociales hace que quien no se actualiza quede rápidamente desfasado, tanto en capacidad de obtener datos como en técnicas de análisis.

Aplicaciones prácticas más habituales de OSINT

Aunque mucha gente asocia OSINT únicamente a hackers y ciberdelincuentes, su campo de aplicación es muchísimo más amplio. Governments, empresas, periodistas y particulares la utilizan de manera legítima a diario.

Ciberseguridad e inteligencia de amenazas

En ciberseguridad, OSINT es la base de las fases de reconocimiento en pentesting, red teaming y ciberinteligencia. Permite mapear infraestructuras, identificar vectores de ataque y entender cómo se ve una organización “desde fuera”.

Herramientas específicas permiten descubrir dominios, subdominios, puertos y servicios expuestos, así como certificados inseguros o configuraciones obsoletas. Este conocimiento sirve para parchear antes de que lo haga el atacante.

Foros especializados, canales de la dark web y fuentes alternativas revelan tendencias en grupos de cibercriminales: nuevos tipos de malware, kits de exploits, ventas de bases de datos robadas o anuncios de accesos comprometidos a empresas concretas.

Investigación periodística y verificación de hechos

Los periodistas utilizan cada vez más técnicas OSINT para verificar noticias, contextualizar conflictos y destapar tramas. Geolocalizar fotos y vídeos, comprobar fechas vía archivos web o contrastar identidades en redes sociales es ya rutina en muchos medios.

Sin una validación adecuada, una captura de pantalla o un tuit pueden ser engañosos. OSINT ayuda a no amplificar bulos, a reconstruir cronologías de hechos y a conectar fuentes de forma rigurosa.

Inteligencia empresarial y análisis de mercado

En el ámbito corporativo, la inteligencia de fuentes abiertas permite entender mejor a la competencia, a los clientes y al propio sector. Analizar webs oficiales, resultados financieros, reseñas, redes sociales o patentes públicas revela movimientos estratégicos y tendencias.

Cruzar datos externos con información interna de la empresa genera una ventaja competitiva. Ayuda a ajustar precios, decidir expansiones, detectar oportunidades de negocio o anticiparse a crisis reputacionales.

Localización y rastreo de personas

OSINT se usa también en búsquedas de personas desaparecidas, investigaciones familiares o rastreo de criminales. Perfiles en redes sociales, etiquetas de ubicación, fotos, registros públicos o noticias son puntos de partida habituales.

La exposición voluntaria que muchos usuarios hacen de su vida privada facilita trazar patrones de movimiento, círculos sociales o hábitos. De nuevo, esto subraya la necesidad de usar estas capacidades con ética y respeto a la privacidad.

Seguridad nacional y defensa

Los servicios de inteligencia y las fuerzas armadas han integrado OSINT como una pieza más de su ciclo de inteligencia, junto a SIGINT (inteligencia de señales), HUMINT (fuentes humanas) o IMINT (imágenes).

Monitorizar redes sociales, medios locales, imágenes satelitales accesibles y bases de datos abiertas ayuda a detectar riesgos, movimientos de actores hostiles o campañas de desinformación. El reto está en lograr ese equilibrio entre seguridad y respeto a derechos fundamentales.

El proceso OSINT paso a paso

Para que OSINT sea algo más que “buscar cosas por Internet”, hay que seguir un ciclo de trabajo ordenado. Aunque cada organización lo adapta a su manera, las fases básicas suelen ser muy parecidas.

1. Definir el objetivo de la investigación

Todo comienza por responder a una pregunta simple: “¿qué quiero saber exactamente?”. No es lo mismo investigar una posible fuga de datos, perfilar a un ciberdelincuente o hacer un estudio de mercado.

Cuanto mejor definido esté el objetivo y el tipo de información que se necesita (correos corporativos, puertos abiertos, alias en redes sociales, documentos filtrados, etc.), más eficaces serán las búsquedas posteriores.

2. Identificar y priorizar las fuentes

Con los objetivos claros, toca decidir dónde buscar primero. Para un incidente de seguridad pueden ser prioritarias bases de datos de brechas, Shodan o Censys; para un estudio reputacional, redes sociales y medios; para un análisis histórico, repositorios y archivos web.

Elegir bien las fuentes desde el principio ahorra tiempo y reduce el volumen de datos irrelevantes. Aun así, es normal ir ampliando el abanico conforme aparecen nuevas pistas.

3. Recopilar información: pasiva, semi‑pasiva y activa

La recopilación de datos se apoya en técnicas y herramientas adaptadas al contexto. El analista decide si conviene ser totalmente discreto o si se puede interactuar abiertamente con el objetivo.

The best way to Disable Protected Mode on Android Cellphone or Pill

En modo pasivo se usan índices, cachés, consultas DNS, herramientas que trabajan sobre datos ya recolectados y fuentes que no requieren interacción directa. Ideal para los primeros pasos, sin dejar huella evidente.

En modo semi‑pasivo se realizan consultas o escaneos muy medidos, limitando el volumen de tráfico y la frecuencia para minimizar la detección. También se recurre a APIs o plataformas que actúan de intermediarias.

La recopilación activa implica contacto directo con el activo investigado: pruebas específicas sobre servicios, correos, mensajes o formularios. Se usa cuando la discreción no es prioritaria o ya se ha asumido que el objetivo es consciente de la investigación.

4. Análisis, filtrado y validación

Una vez recogidos los datos, empieza el trabajo duro: separar lo que vale de lo que sobra. Esto supone eliminar duplicados, descartar información obsoleta, detectar incoherencias y cruzar fuentes para comprobar la veracidad.

Una buena práctica es etiquetar la información según su fiabilidad y origen (oficial, testimonio, rumor, datos técnicos, etc.). De este modo, los decisores pueden valorar hasta qué punto confiar en cada hallazgo.

5. Presentar resultados de forma clara

El valor de una investigación OSINT se pierde si los hallazgos se presentan de forma confusa. Los informes deben ser comprensibles para personas que quizá no tengan perfil técnico.

Es habitual utilizar esquemas, grafos y gráficos para visualizar relaciones entre personas, dominios, IPs, empresas o eventos. Herramientas como Maltego o Gephi ayudan muchísimo a convertir datos en mapas visuales que facilitan la toma de decisiones.

Herramientas y técnicas OSINT que debes dominar

El ecosistema OSINT evoluciona a toda velocidad, pero hay un conjunto de herramientas y técnicas que se han convertido en casi “imprescindibles” para cualquier analista, tanto principiante como avanzado.

Google Dorks y GooFuzz

Los Google Dorks (o Google Hacking) son búsquedas avanzadas que utilizan operadores específicos como site:, filetype:, intext: o intitle: para exprimir al máximo el buscador.

Combinando palabras clave y operadores se pueden localizar documentos sensibles, paneles de administración, listados de índices o archivos de respaldo que nunca deberían estar expuestos pero que, por mala configuración, terminan en los resultados.

GooFuzz es una herramienta ligera que automatiza muchas de estas consultas especiales sin enviar peticiones directas al servidor web objetivo, reduciendo así el riesgo de levantar alertas mientras se rastrean directorios, ficheros o configuraciones problemáticas.

Shodan, Censys y Netlas

Shodan y Censys son motores de búsqueda para dispositivos conectados a Internet. Escanean enormes rangos de IP y almacenan la información que devuelven los servicios expuestos: banners, puertos, protocolos, certificados, etc.

Son esenciales para detectar servidores, cámaras, routers o dispositivos IoT accesibles desde fuera, así como para evaluar si hay servicios con versiones vulnerables o configuraciones poco seguras.

Netlas funciona de forma similar, añadiendo capacidades de búsqueda a través de certificados y una vista en forma de nodos que ayuda a visualizar rápidamente la infraestructura de un objetivo y sus relaciones.

Maltego y el análisis relacional

Maltego es una plataforma gráfica diseñada para representar relaciones entre entidades: dominios, IPs, correos electrónicos, usuarios de redes sociales, organizaciones, etc.

Mediante “transforms” conectados a múltiples fuentes (Shodan, Netlas, VirusTotal, Censys, URLscan, redes sociales…), el analista puede pasar de un simple dato (por ejemplo, un correo) a un grafo complejo que muestre dominios asociados, IPs históricas, posibles alias de usuario o servicios relacionados.

TheHarvester, Recon‑ng y SpiderFoot

Estas herramientas se centran en la recopilación automatizada de información técnica y de exposición. Suelen formar parte de las primeras fases de un reconocimiento.

TheHarvester permite obtener correos electrónicos, subdominios, hosts y nombres de usuario desde múltiples fuentes públicas como motores de búsqueda, repositorios, redes sociales o servicios DNS.

Recon‑ng funciona como un framework modular de reconocimiento que integra distintos módulos para trabajar con APIs, recolectar datos y generar informes, todo desde una consola organizada por proyectos.

SpiderFoot combina decenas de módulos para realizar un reconocimiento muy amplio sobre dominios, IPs, direcciones de correo, nombres de usuario y más, ofreciendo una visión global de la huella digital de un objetivo.

OSINT Framework y otros repositorios

OSINT Framework y proyectos similares como OSINTCombine agrupan cientos de recursos ordenados por categorías: redes sociales, buscadores, automatización, dark web, registros públicos, datos financieros, etc.

Son ideales para quienes empiezan porque sirven de mapa para no perderse entre miles de herramientas dispersas y descubrir utilidades específicas para cada tipo de caso (búsqueda de personas, análisis de dominios, metadatos, etc.).

Redes sociales, alias y OSINT móvil

Un bloque fundamental de cualquier investigación actual es la huella en redes sociales. Alias, fotos, publicaciones, comentarios y listas de amigos construyen un perfil muy detallado de una persona o entidad.

Herramientas como Namechk, Sherlock, Maigret o WhatsMyName permiten buscar un nombre de usuario en decenas o cientos de plataformas a la vez, revelando dónde existe un perfil con ese alias y facilitando la consolidación de identidades digitales.

Además, existen aplicaciones y servicios especializados en analizar actividad en Twitter/X, Facebook, Instagram, Telegram o foros concretos, detectar tendencias, mapear redes de contactos o rastrear hashtags y canales relevantes.

La geolocalización de imágenes, la búsqueda inversa (Google Images, Yandex, TinEye) y la extracción de metadatos con herramientas como ExifTool, FOCA o Metagoofil añaden una capa extra de información: ubicaciones aproximadas, dispositivos usados, software, fechas reales de creación de archivos, etc.

Add Pictures to iCloud from iPhone, iPad & Mac

Archivos web y preservación de evidencias

Wayback Machine y servicios como Archive.ph permiten “viajar al pasado” y ver cómo era una web en una fecha concreta. Esto resulta útil para probar que cierta información estuvo publicada aunque hoy haya sido borrada.

Además, algunas herramientas facilitan la captura forense de páginas, guardando contenido, fecha y contexto para que esa prueba sea presentable en auditorías, procedimientos judiciales o informes técnicos.

Monitorización de amenazas y automatización

La integración de OSINT con sistemas de alerta y automatización está cobrando fuerza. Proyectos como bots de ransomware o monitores de DNS permiten recibir avisos en tiempo casi real.

Por ejemplo, existen bots que notifican sobre dominios incautados por las autoridades, cambios súbitos de DNS o menciones de una marca o dominio en foros delictivos. Esto encaja cada vez más en los pipelines de ciberinteligencia de empresas y organismos públicos.

Caso práctico: investigación tras un posible robo de datos

Imagina que una empresa sospecha que se han filtrado credenciales corporativas y quiere saber si esa información está circulando por la red.

El equipo de OSINT podría comenzar consultando bases públicas de brechas como Have I Been Pwned (o alternativas similares) para verificar si correos con dominio corporativo aparecen en filtraciones conocidas y bajo qué servicios.

En paralelo, se pueden lanzar Google Dorks para descubrir documentos sensibles indexados (por ejemplo, hojas de cálculo o listados internos) y usar Shodan, Censys o Netlas para verificar si hay servidores o servicios expuestos innecesariamente.

Además, revisar la actividad pública en redes sociales de empleados clave puede mostrar publicaciones imprudentes, fotos de pantallas, URLs internas o detalles sobre la infraestructura.

Con toda esa información, el equipo puede descubrir, por ejemplo, que un servidor interno quedó accesible y fue indexado por buscadores, que algunas contraseñas eran débiles y que ciertos documentos no estaban cifrados.

A partir de ahí se toman medidas: reforzar la configuración, forzar cambios de contraseña, restringir el acceso, desindexar contenido y notificar a las personas afectadas, reduciendo en gran medida el impacto potencial del incidente.

Cómo empezar en OSINT desde cero sin volverte loco

Entrar en el mundo OSINT puede abrumar al principio por la cantidad de herramientas, técnicas y fuentes. Lo importante es avanzar paso a paso, con cabeza y sin querer abarcarlo todo el primer día.

Lo primero es tener clara la base: entender qué es OSINT, qué no es y cuál es su marco legal. A partir de ahí, conviene formarse con buenos tutoriales, blogs y cursos introductorios, preferiblemente asequibles o gratuitos al inicio, y herramientas como Google NotebookLM para organizar el conocimiento.

Un punto fundamental es “aprender a pensar como Google”: cómo indexa, cómo funcionan los operadores avanzados y qué tipo de contenido se expone sin que los administradores sean conscientes. Dominar bien los Dorks te da una ventaja enorme con muy pocas herramientas.

A partir de esa base, toca practicar: plantear pequeñas investigaciones, probar búsquedas con diferentes operadores, verificar resultados y documentar lo que se consigue. El aprendizaje real viene de la práctica constante.

No todo es Google: explorar otros buscadores como Bing, Yandex o Baidu abre la puerta a resultados que no aparecen en el buscador principal, sobre todo cuando se investigan entornos geográficos o lingüísticos concretos.

Después llega el momento de montar tu “caja de herramientas” personal: elegir utilidades para correos, alias, dominios, metadatos, redes sociales, etc., y aprender a usarlas con soltura. No hace falta tener 200 instaladas; mejor pocas y bien dominadas.

No es imprescindible ser programador o ingeniero informático para iniciarse en OSINT, aunque una buena base en sistemas, especialmente en Linux y en conceptos de ciberseguridad, te hará la vida más fácil y te convertirá en un operador más sólido.

La paciencia es clave: los resultados espectaculares no llegan el primer día, y siempre habrá alguien que sepa más que tú. La actitud adecuada es seguir aprendiendo, seguir a referentes del sector, practicar y mejorar poco a poco.

Con el tiempo, cuando ya domines buscadores, herramientas y metodología, podrás considerarte con toda propiedad “operador OSINT” y decidir si quieres especializarte en ciberseguridad, análisis criminal, inteligencia corporativa, periodismo de datos u otro campo afín.

En un entorno donde cada clic deja rastro y cada servicio genera datos públicos o semipúblicos, conocer y aplicar bien las técnicas OSINT se ha convertido en una ventaja profesional y operativa enorme. Contar con un método claro, usar herramientas adecuadas y mantener siempre el foco ético y legal permite transformar ese mar de información aparente en inteligencia realmente útil, tanto para proteger activos y descubrir amenazas como para investigar, informar mejor o tomar decisiones estratégicas en cualquier organización.