- Els PDFs inclouen metadades ocultes (autor, dates, programari, etiquetes) que poden revelar informació sensible si no es controlen.
- És més segur gestionar i esborrar metadades amb eines d'escriptori (PDFelement, PDFgear, LibreOffice, Adobe Acrobat Pro) que amb serveis en línia.
- En entorns professionals convé implantar bones pràctiques i fluxos de treball per revisar, normalitzar o netejar metadades abans de compartir qualsevol PDF externament.

Els PDF semblen documents tancats, però en realitat solen portar molta informació oculta en forma de metadades. S'hi guarda qui va crear l'arxiu, amb quin programa, quan es va modificar per última vegada o fins i tot etiquetes internes que ajuden a classificar el document. Tota aquesta informació no es veu a simple vista, però viatja amb el PDF cada cop que el comparteixes per correu, núvol o missatgeria; la pots analitzar amb l'eina FOCA.
Si treballes amb documentació sensible, contractes, informes interns o projectes de clients, és molt possible que no vulguis que aquesta informació viatgi per aquí sense control. Aprendre a veure, editar, esborrar o “netejar” les metadades d'un PDF és una mesura de privadesa bàsica, tant a nivell personal com professional, per exemple per protegir documents amb etiquetes de confidencialitat. A veure amb detall què són, per què convé controlar-los i com gestionar-los en PDF pas a pas amb diferents eines.
Què són les metadades d'un PDF i per què t'has de preocupar
Quan parlem de metadades ens referim a dades que descriuen una altra dada o fitxer. No són el contingut principal, sinó informació addicional que l'acompanya. En una foto feta amb el mòbil, per exemple, la metadada pot incloure la data, el model de la càmera, les coordenades GPS o si s'ha aplicat un filtre. Amb els documents ofimàtics i els PDFs passa una cosa semblant.
En un document creat amb Paraula, Excel, PowerPoint, LibreOffice o similars, les metadades poden revelar el nom real de l'autor, el nom de l'empresa, la ruta interna del fitxer al servidor, l'organització, l'equip o fins i tot comentaris interns. Tot això es pot filtrar sense voler quan aquest fitxer es converteix a PDF i s'envia a un client, proveïdor o es publica a la web; per a documents generats a Office pots consultar com eliminar metadades i comentaris de Word.
Els fitxers PDF tenen la seva pròpia estructura de metadades. A nivell bàsic inclouen camps com Títol, Autor, Assumpte, Paraules clau, data de creació, data de modificació, el programa amb què es va crear el PDF, la versió de PDF, mida de pàgina, nombre de pàgines, etiquetes, i també informació sobre seguretat (si teniu contrasenya, restriccions de còpia o impressió, etc.).
A més d'aquest bloc bàsic, els PDFs moderns poden incorporar metadades avançades usant fluxos de metadades basades en XMP (Extensible Metadata Platform), un estàndard ISO creat per Adobe i usat també en formats com JPG o SVG. Aquests fluxos permeten desar molta més informació estructurada sobre el document, els drets d'autor, l'estat de revisió, l'idioma, etc.
Tota aquesta informació té usos legítims: millorar el posicionament en cercadors, complir estàndards daccessibilitat, organitzar fitxers en grans repositoris o identificar fàcilment la font del document. El problema apareix quan aquestes dades no estan pensades per sortir de l'organització o exposen detalls privats que no vols compartir.
Riscos de compartir PDFs amb metadades sensibles
Per entendre el risc, només cal fer una prova ràpida al teu propi equip: tria un document PDF o d'oficina, fes clic dret, entra a Propietats i revisa la pestanya de Detalls o Descripció. Veuràs que, sense ser-ne conscient, fa temps que envies més informació de la que esperaves.
A l'entorn empresarial, en enviar propostes, ofertes, informes tècnics o documentació legal, aquestes metadades poden revelar noms de treballadors, rutes de carpetes internes, estructura de servidors, denominacions de projectes interns o noms reals dels redactors. Si aquest contingut cau en mans equivocades, es pot fer servir per a enginyeria social, espionatge competitiu o simplement per deixar en evidència informació que s'hauria d'haver mantingut privada.
També a nivell personal es poden filtrar dades que potser no vulguis compartir, com l'usuari del teu ordinador, l'eina concreta que utilitzes, la data exacta de creació d'un document o versions anteriors que indiquin quant de temps portes treballant en alguna cosa. No és que tot sigui un desastre de seguretat, però és millor decidir conscientment què comparteixes i què no.
Cal tenir en compte a més que algunes metadades es poden modificar fàcilment amb les eines adequades. Això vol dir que algú podria alterar l'autor, les dates o certs camps per manipular un document o intentar fer-lo passar per un altre. Per això, en contextos legals o de compliment normatiu, es controla molt bé quines metadades es conserven i quines s'eliminen.
En resum, les metadades són útils, sí, però si no els gestiones bé, es poden convertir en una font de fuga d'informació. Per això és tan important saber com revisar-los i netejar-los abans d'enviar PDFs fora del teu entorn de confiança.
Com s'emmagatzemen les metadades en un fitxer PDF
Dins d'un PDF hi ha dos mecanismes principals per guardar metadades: el diccionari d'informació (Info Dictionary) i els fluxos de metadades basades en XMP. Tots dos coexisteixen i moltes eines et permeten accedir a un o altre.
El diccionari d'informació és present des de la versió 1.0 de l'estàndard PDF i agrupa els camps més habituals: Autor, Títol, Assumpte, Paraules clau, dates de creació i modificació. És el que la majoria dusuaris veu quan obre les “Propietats” d'un PDF des d'un visor estàndard.
D'altra banda, els fluxos de metadades XMP permeten desar conjunts d'informació molt més rics i personalitzats. A través d'aquestes dades s'afegeixen dades com ara idioma del document, drets d'autor detallats, informació sobre el flux de treball editorial, estat de revisió, identificadors únics, informació de llicències o etiquetes més específiques.
Això fa que, encara que esborris els camps bàsics d'Autor o Títol des d'una finestra de propietats senzilla, pugui continuar quedant informació embeguda en els fluxos XMP si l'eina que fas servir no neteja tot a fons. Per això, per eliminar metadades de forma realment segura, convé fer servir eines que esborrin tant el diccionari bàsic com les metadades esteses.
En entorns d'alt nivell (per exemple, administracions públiques o grans corporacions) es fan servir fins i tot eines de “sanitització” de PDFs que no només netegen metadades, sinó també revisions ocultes, comentaris, capes, adjunts, scripts i qualsevol rastre que pugui filtrar informació no desitjada.
Quan convé eliminar o modificar metadades en PDFs
No sempre és bona idea esborrar-ho tot. En alguns casos, voleu que el document tingui autor, títol i paraules clau per millorar la cerca o el posicionament. No obstant això, en molts escenaris sí que resulta recomanable revisar i reduir al mínim les metadades abans de compartir un PDF.
Alguns motius habituals per eliminar o editar metadades són la seguretat i privacitat: t'interessa que el receptor vegi el contingut del PDF, però no dades secundàries sobre qui el va crear, des de quin equip oa quina ruta interna estava desat. Això aplica tant a empreses com a professionals autònoms i particulars.
Una altra raó freqüent és la confidencialitat de l'autor o de l'organització. Pot ser que una agència prepari un informe per a un client final i no vulgueu que apareguin els noms individuals de les persones que el van escriure ni les dades de l'empresa subcontractada, sinó només la marca del client.
També hi ha motius d'integritat i de control: com més camps oberts a edició deixes, més marge n'hi ha perquè algú els manipuli. Si algú modifica, per exemple, la data de creació del document o l'autor, podeu intentar generar dubtes sobre l'autoria o el moment en què es va generar el PDF.
Finalment, algunes vegades eliminar metadades pot reduir lleugerament la mida del fitxer. No estalviaràs megues i megues, però si manegues grans volums de PDFs en automatització, tot suma. En qualsevol cas, lobjectiu principal continua sent la protecció de la informació.
Precaucions abans de fer servir eines online per esborrar metadades
A Internet abunden les pàgines que prometen eliminar metadades de PDF amb només pujar el fitxer. Són còmodes i útils per a casos puntuals, però cal tenir una cosa molt clara: perquè puguin treballar sobre el teu document, primer ho has de enviar a un tercer.
Si el PDF conté dades personals, informació confidencial de l'empresa, secrets comercials o documentació sensible, pujar-ho a una web que no controles és, com a mínim, arriscat. Per molt segura que sigui la connexió (HTTPS) i per molt que la pàgina prometi esborrar el fitxer al cap d'unes hores, en realitat no saps què passa amb aquestes dades entre bambolines.
El més prudent, especialment en entorn professional, és prioritzar eines instal·lades al teu propi equip (escriptori) per fer l'esborrament o modificació de metadades de forma local. Així evites que el document surti de la teva xarxa i mantens el control complet sobre el que hi fas.
Només tindria cert sentit fer servir serveis en línia per a documents totalment públics o sense cap sensibilitat, i tot i així és recomanable llegir les condicions d'ús i política de privadesa per saber què fan amb els arxius pujats i durant quant de temps els emmagatzemen.
En resum, si es tracta de documentació seriosa, no te la juguis: millor netejar les metadades amb programes instal·lats a la teva màquina que dependre de pàgines web de tercers.
Editar i esborrar metadades de PDF amb programari descriptori

Si vols tenir control real sobre el que fas amb els teus documents, el que és seu és fer servir un editor de PDF instal·lat al teu ordinador. Hi ha eines més avançades i de pagament, com Adobe Acrobat Pro, i altres opcions gratuïtes o de menor cost, com ara PDFelement o PDFgear, que també resolem aquí.
En general, el procés en aquest tipus de programes es basa en tres passes: obrir el PDF, accedir a les propietats del document i editar o deixar buits els camps de metadades. El que canvia duna eina a una altra és la ruta exacta de menús, les opcions disponibles i fins a quin nivell arriba la neteja.
PDFelement, per exemple, es presenta com una alternativa econòmica i senzilla davant d'Acrobat Pro. El seu enfocament és fer accessible l'edició de PDFs a usuaris que no volen complicar-se amb menús avançats. Només cal obrir el PDF, anar a la pestanya d'Arxiu, entrar a Propietats i després a Descripció. Des d'aquí pots editar o esborrar els camps de metadades usant simplement la tecla Retrocés o Suprimir del teclat.
El que té de bo aquest tipus de programes és que, a més de gestionar metadades, solen incloure altres funcions de seguretat i edició: aplicar contrasenyes i restriccions, afegir signatures digitals per garantir l'autenticitat del document, redactar (censurar) de manera permanent informació confidencial, realitzar OCR per reconèixer text, convertir PDFs a Word, Excel o imatges, i molt més.
PDFgear és una altra opció gratuïta pensada per modificar la informació bàsica dels PDF com a títols, autors i paraules clau. El seu funcionament és molt directe: obris el fitxer, entres a Propietats del Document amb clic dret i, dins de la finestra, canvies o esborres els camps de metadades que vulguis abans de tornar a desar el fitxer.
Modificar metadades de PDF amb LibreOffice
LibreOffice és una suite ofimàtica gratuïta i de codi obert que funciona a Windows, macOS i Linux. Entre els seus components hi ha LibreOffice Draw, que permet obrir i editar PDFs de forma bàsica, incloent l'edició de metadades abans de tornar a exportar el fitxer.
El flux típic consisteix a obrir el PDF a LibreOffice Draw usant l'opció de Arxiu> Obrir. Un cop carregat el document, s'accedeix al menú Fitxer > Propietats, on apareix una finestra amb diverses pestanyes. La pestanya de Descripció permet editar camps com Títol, Tema, Paraules clau i Comentaris.
Després d'actualitzar aquests camps, és important exportar de nou el document com a PDF des de Fitxer > Exportar com a > Exportar com a PDF. Així us assegureu que els canvis s'apliquin al nou fitxer generat. D'aquesta manera podeu homogeneïtzar metadades en documents d'una mateixa col·lecció o retirar informació que no voleu compartir.
LibreOffice és especialment útil si ja el fas servir com a solució ofimàtica general, perquè no necessites instal·lar res addicional per corregir les metadades d'un PDF de tant en tant. Això sí, el seu enfocament és més generalista: no neteja tants detalls avançats com a eines de seguretat específiques, però per a ús habitual és més que suficient.
En aquells entorns on es treballa tant amb PDF com amb documents de text, fulls de càlcul o presentacions, tenir una solució unificada com LibreOffice pot simplificar molt la gestió de metadades en tots els formats.
Eliminar metadades de PDF amb Adobe Acrobat Pro
Adobe Acrobat Pro continua sent la eina de referència per al maneig avançat de PDFs. Entre les seves múltiples funcions, permet revisar, editar i eliminar metadades bàsiques i avançades, a més de fer una neteja profunda d'elements ocults.
Per gestionar les metadades a Acrobat Pro, el primer pas és obrir l'arxiu PDF i dirigiu-vos al menú Fitxer > Propietats. A la finestra de Propietats del document trobarem diverses pestanyes; la de Descripció mostra els camps habituals com ara Títol, Autor, Tema i Paraules clau.
Des d'aquesta pestanya pots editar directament o esborrar el contingut dels camps que no vulguis mantenir. Si necessiteu anar un pas més enllà, el botó de “Metadades addicionals…” obre una vista més detallada, on és possible gestionar informació XMP més avançada, incloent camps personalitzats i dades de drets d'autor.
Un cop realitzats els canvis, només cal prémer Acceptar i després desar el fitxer (Fitxer > Desa o Ctrl+S) perquè el PDF quedi actualitzat sense aquestes metadades. Tingues en compte que algunes funcions més profundes de neteja només estan disponibles a la versió professional d'Acrobat.
El gran avantatge d'Acrobat Pro és que, a més del tema de metadades, inclou eines de redacció per censurar text i imatges de forma irreversible, protecció amb contrasenya, signatura digital avançada, gestió de lots i altres funcions que reforcen la seguretat dels teus documents. Si maneges documentació crítica de manera habitual, pot valdre la pena la inversió.
Editar metadades de PDF online: avantatges i inconvenients
Si només necessites canviar alguna dada puntual d'un PDF sense instal·lar programari, hi ha serveis en línia que permeten editar metadades directament des del navegador. Entre els més coneguts hi ha plataformes com Metacleaner, Sejda o PDF Candy, que ofereixen un editor de camps bàsics tipus Títol, Autor, Tema i Paraules clau.
El funcionament sol ser semblant en gairebé tots: puges l'arxiu amb un botó tipus “Pujar arxiu PDF”, el servei carrega el document i et mostra un formulari amb els camps de metadades que podeu editar. Després de fer els canvis, polses a “Actualitzar metadades” o similar i DESCÀRREGUES el nou fitxer ja modificat.
Aquestes eines en línia tenen limitacions: solen restringir la mida del fitxer, el nombre de pàgines o la quantitat de tasques gratuïtes per hora. Per exemple, algunes imposen un topall de 200 pàgines o 50 MB i permeten només tres operacions cada hora si no passes a la versió de pagament.
A més d'aquestes restriccions tècniques, apareix de nou el tema clau de la privadesa. Encara que moltes webs prometen esborrar els fitxers dels seus servidors de forma automàtica al cap de poques hores, no tens control real sobre el procés ni garanties plenes de confidencialitat.
Per això, aquests serveis et poden venir bé per ajustaments ràpids en documents no sensiblesperò no són la millor opció quan el contingut és delicat, forma part de processos interns o compromet dades personals. En aquests casos, sempre serà preferible recórrer a un editor local que mantingui els fitxers dins del teu entorn.
Eines especialitzades i automatització de metadades
Per a usuaris avançats o administradors que manegen grans volums de documents, hi ha eines manuals i també opcions programàtiques que permeten editar metadades en lot o integrar-les en fluxos de treball automatitzats.
Aplicacions com ExifTool, molt conegudes al món de la fotografia, també serveixen per a llegir i modificar metadades en PDF des de línia de ordres. Amb elles es poden tractar centenars de fitxers de cop, eliminar camps concrets o unificar la informació d'autor i títol en col·leccions completes.
Si tens coneixements de programació, pots recolzar-te en biblioteques com PyPDF2 a Pitó o Apache PDFBox a Java per modificar metadades de manera programàtica. Això és especialment útil quan necessiteu integrar el sanejament de PDFs en un sistema de gestió documental, un flux de publicació automatitzat o processos interns d'una organització; per exemple, pots seguir guies per automatitzar tasques d'arxius a Windows.
Aquestes solucions també solen permetre combinar l'esborrament de metadades amb altres tasques: anomenat massiu d'arxius, conversió de formats, aplicació de marques d'aigua, xifratge, etc. Amb una mica de treball inicial, pots deixar muntat un procés que revisi una carpeta i netegi les metadades de tot allò que entra abans de treure'l a l'exterior.
Això sí, fer servir aquestes eines exigeix un mínim de coneixement tècnic i un bon pla de proves per no eliminar per error informació rellevant. En entorns on es requereixi traçabilitat, de vegades és millor normalitzar que esborrar del tot, deixant almenys certes metadades controlades.
Consells pràctics per gestionar metadades en PDF de forma segura
Més enllà de les eines concretes, convé adoptar bones pràctiques generals en el maneig de metadades dins de la teva organització oa nivell personal. Això redueix ensurts i fa més fàcil complir polítiques internes o normatives de protecció de dades.
Un primer pas és conscienciar els usuaris. Molta gent ni tan sols sap que aquestes dades existeixen, així que és útil mostrar com veure les propietats d'un fitxer i quins camps apareixen. A partir d'aquí, es poden establir pautes bàsiques sobre què cal emplenar, què cal esborrar i qui és el responsable de revisar els documents abans d'enviar-los.
També és recomanable definir plantilles i fluxos de treball on ja es controli des de l'origen quines metadades s'incorporen als documents. Si utilitzeu Word, LibreOffice o altres aplicacions per generar els originals, convé configurar plantilles que no incloguin dades personals innecessàries o que usin camps genèrics en lloc de noms concrets.
En organitzacions mitjanes o grans pot ser interessant assignar una eina estàndard per tractar PDFs (Acrobat Pro, PDFelement, PDFgear, etc.) i formar els equips en el seu ús, de manera que tothom segueixi el mateix procediment per netejar o ajustar metadades abans de compartir un document cap a fora.
Finalment, tingues sempre present que, quan el document és especialment delicat, potser no n'hi ha prou amb les metadades: la censura (redacció) de contingut dins del PDF i la protecció amb contrasenya o xifrat han de formar part del mateix paquet de seguretat. La metadada és només una peça més del puzle.
Si integres aquestes pràctiques al teu dia a dia, aconseguiràs que els PDFs que envies portin exactament la informació que tu vols, ni més ni menys, reduint el risc de filtracions invisibles a través de metadades descurades.
Controlar les metadades dels teus PDFs no és només una qüestió tècnica, sinó de sentit comú: igual que revises el contingut visible abans d'enviar un document, també hauries de revisar allò que no es veu a primera vista. En conèixer què són les metadades, com s'emmagatzemen i quines eines tens per veure'ls, editar-los o esborrar-los (des d'editors d'escriptori com PDFelement, PDFgear, LibreOffice o Adobe Acrobat Pro, fins a solucions online o programàtiques), pots adaptar cada cas al nivell de seguretat i privadesa que necessites i evitar exposar més informació de la que realment vols compartir.
Redactor apassionat del món dels bytes i la tecnologia en general. M'encanta compartir els meus coneixements a través de l'escriptura, i això és el que faré en aquest bloc, mostrar tot el més interessant sobre gadgets, programari, maquinari, tendències tecnològiques, i més. El meu objectiu és ajudar-te a navegar pel món digital de forma senzilla i entretinguda.
