- Описателните, административните и структурните метаданни формират основата за идентифициране, управление и организиране на всеки дигитален ресурс.
- Административните метаданни обхващат технически, правни, аспекти на съхранение и произход, които са от съществено значение за управлението и съответствието с регулаторните изисквания.
- Структурните метаданни определят йерархията и връзките между частите на цифровия обект, което позволява последователна навигация и дългосрочно съхранение.
- Това „ядро“ се поддържа от други видове метаданни (процес, употреба, местоположение, социални и сигурност), които допълват изгледа и позволяват автоматизиран контрол, анализ и защита.
Насред информационното претоварване, което изпитваме, Метаданните са се превърнали в невидимата нишка, която поддържа реда в дигиталния хаос.Всеки път, когато запазвате документ, правите снимка с мобилния си телефон или качвате видеоклип в облака, вие не просто създавате файл: вие също така генерирате набор от скрити данни, които го описват, поставят го в контекст и позволяват на системите и хората да го намират и управляват интелигентно.
Интересното е, че това Не всички метаданни служат за една и съща цел: описателните, административните и структурните метаданни образуват „основно трио“ което е от съществено значение за всяка среда, която работи сериозно с информация, от дигитална библиотека или исторически архив до компания, подчинена на разпоредби за защита на данните или строги политики за управление на данните.
Какво представляват метаданните и защо са толкова важни днес?
Когато говорим за метаданни, ние буквално говорим за „данни за данни“: информация, която описва, контекстуализира и организира друго съдържаниеТова е информацията кой, какво, кога, къде, как и при какви условия използва даден файл или набор от данни, без да е необходимо да го отваряте или четете, за да разберете за какво става въпрос.
В дигитална снимка, например, Метаданните могат да включват дата на заснемане, модел на камерата, GPS местоположение, резолюция или автор, и можете Редактиране или изтриване на EXIF метаданни на Android.
Този допълнителен слой информация служи за описват, локализират, управляват и съхраняват цифрови ресурси през целия им жизнен цикълБез него, едно хранилище би било малко повече от разбъркана бъркотия от файлове с загадъчни имена, където намирането на нещо конкретно или осигуряването на дългосрочното му съхранение би било истинска одисея.
Освен това, в контекста на големите данни, интернет на нещата, облачните технологии и разпределените архитектури, Метаданните са се превърнали в ключов елемент за оперативна съвместимост между системите, автоматизация на процесите и съответствие с регулаторните изисквания.. Разширени платформи като FOCA Те използват именно този метаслой, за да откриват чувствителна информация, да я етикетират и автоматично да я защитават.
Класификация на метаданните: много повече от три вида
Когато се опитваме да организираме ситуацията, често се казва, че Има три основни категории метаданни: описателни, административни и структурни.Това са тези, които използват стандарти като METS или насоки за архивни метаданни за управление на сложни цифрови обекти.
Въпреки това, в професионалната практика Тази класификация обикновено се усъвършенства още повече, за да обхване по-добре всички нюанси.Въз основа на специализирана литература и ръководства от организации като национални библиотеки, архиви и технологични компании, е обичайно да се открият поне следните видове:
- Описателни метаданни
- Административни метаданни (технически, права, запазване, произход, дигитален произход)
- Структурни метаданни
- Метаданни за процеса
- Метаданни за употреба
- Метаданни за местоположението (географски и времеви)
- Социални метаданни
- Метаданни за сигурност
Въпреки това, централният фокус на това съдържание е върху Описателни, административни и структурни метаданни, защото те са основата, върху която се изграждат останалите. и тези, които обикновено са изрично цитирани в стандартите за дигитален обмен и съхранение, като например METS.
Описателни метаданни: даване на „собствено и фамилно име“ на ресурсите
Описателните метаданни са тези, които Те ви позволяват да идентифицирате, представите и локализирате информационен ресурс, без да е необходимо да го отваряте.Те действат като каталожен запис или визитна картичка на дигитален обект.
На практика, Тези метаданни събират елементите, които използваме за търсене и разпознаване на съдържание в каталози, мениджъри на документи, търсачки или хранилища: какво би въвел потребителят в полето за търсене, за да намери нещо.
Типичните елементи на описателните метаданни включват:
- Заглавие на произведението, документа или ресурса.
- Автор или създател (лице, организация или услуга).
- Резюме или кратко описание на съдържание.
- ключови думи и обхванати теми (етикети, предмети, категории).
- Език където се намира съдържанието.
- Дата на създаване или публикуване.
- Тип съдържание (текст, изображение, аудио, видео, набор от данни и др.).
- Файлов формат (PDF, JPEG, MP3, CSV… когато се използва за основни описания).
- Постоянни уникални идентификатори като DOI, ISBN, идентификатор или PURL.
- Физически или формални атрибути релевантни в контекста на наследството, като например размерите на дигитализиран обект.
Те се прилагат често в библиотеки и дигитални архиви. стандартизирани схеми като Dublin Core или MARC за кодиране на тези описателни метаданниВ уеб света част от тази информация е отразена в мета HTML тагове и речници за структурирано описание, като например Schema.org, които също помагат на SEO, като предоставят на търсачките ясни данни за ресурса.
Полезността му е очевидна: Без добри описателни метаданни, търсенето и извличането на информация става бавно, неточно и обезсърчително.Няма значение дали имаме хиляди сканирани документи, ако няма начин да ги намерим по заглавие, тема, автор или дата.
Административни метаданни: управление, права и съхранение
За разлика от описателните данни, административните метаданни Те се фокусират върху всичко, което прави възможно управлението, запазването и правилното използване на цифров ресурс.Тук ще обсъдим както по-техническите аспекти, така и правните аспекти, свързани със съхранението и произхода.
В архивната и библиотечната практика, както и в напреднали корпоративни среди, Административните метаданни обикновено се разделят допълнително на няколко подкласа:
- Технически метаданни
- Метаданни за правата
- Метаданни на източника
- Метаданни за цифрови източници
- Метаданни за запазване (често интегрирано в горното)
Технически административни метаданни
Технически метаданни Те включват техническите характеристики на архива и процеса на неговото създаване.Те са жизненоважни, за да се знае дали даден обект ще остане достъпен в бъдеще и да се оцени качеството на неговата дигитализация.
В случай на дигитализирано изображение, например, те биха могли да включват:
- Тип и модел на скенер или устройство за заснемане.
- резолюция (напр. 600 dpi), битовата дълбочина y цветово пространство.
- Формат на файла (некомпресиран TIFF, JPEG със специфичен алгоритъм и др.).
- Метод на компресия и приложени параметри.
- Източник на светлина или условия на заснемане, ако са от значение.
- Информация за софтуера използвани при редактиране или обработка, или как Премахване на метаданни и коментари от Word.
В по-общи контексти се включват и основни данни, като например размер на файла, тип носител, дати на създаване и промяна, вътрешни идентификатори и специфични технически метаданни (аудио битрейт, видео кодек, структура на таблицата на базата данни и др.).
Метаданни за права и употреба
Друг важен аспект на административните метаданни е метаданни, свързани с авторски права, лицензи, ограничения за достъп и условия за ползванеТова би включвало както метаданните за правата в тесен смисъл, така и голяма част от така наречените метаданни за употреба.
Типичните елементи включват:
- Притежател на права (лице или организация).
- Тип лиценз (например, специфичен за Creative Commons, търговски лиценз, вътрешно прехвърляне и др.).
- Ограничения за достъп (кой може да преглежда, изтегля, редактира или споделя ресурса).
- Условия за ползване за търговска или некомерсиална употреба.
- Изисквания за посочване на авторството или цитиране.
- Дата на регистрация на правата или валидността на лиценза.
- Политики за задържане и опазване свързани с правни или регулаторни задължения.
Този тип информация се е превърнала в ключова за спазват разпоредби като GDPR, HIPAA, закони за интелектуална собственост или стандарти за сигурност като ISO 27001Решенията за класификация, базирани на изкуствен интелект, разчитат именно на тези метаданни, за да идентифицират чувствителна документация, да прилагат етикети за поверителност и да активират политики за защита или криптиране.
Метаданни за дигитален произход и посредничество
Метаданни на източника Те описват ресурса, от който произхожда дигиталната версия.Например, ако изображението е от аналогова снимка 4×5, оригинален ръкопис или директно заснемане на място.
Метаданните, получени с дигитален източник, от своя страна, Те документират историята на трансформациите, които е претърпял дигиталният обект. от създаването му или първоначалната му дигитализация: миграции на формати, промени в кодеци, процеси на възстановяване, стандартизации и др.
Тези два подтипа, заедно с техниците, Те предоставят основната информация за дългосрочно дигитално съхранение и да се оцени дали копието е вярно на оригинала или каква степен на намеса е била направена върху него.
Административни метаданни в METS и други стандарти
В стандарта METS, широко използван в библиотеките и архивите, разделът с административните метаданни ( ) е прецизно подразделен на четири блока:
- – технически метаданни.
- – метаданни за правата.
- – метаданни на източника.
- – метаданни от дигитален източник.
Всеки от тях може да съдържа вътрешно кодирани метаданни в XML или препратки към външни записи (използвайки URN, URL, DOI, Handle и др.) и всички имат свои собствени идентификатори, за да могат да бъдат свързани с конкретни файлове или структурни подразделения на описвания обект.
Структурни метаданни: как са организирани и свързани частите
Докато описателните метаданни казват „за какво става въпрос“, а административните метаданни казват „как се управлява“, Структурните метаданни обясняват как са организирани различните компоненти, които изграждат сложен дигитален обект. и какви взаимоотношения съществуват между тях.
Нека помислим за дигитализирана книга: Това не е просто колекция от отделни изображения, а поредица от страници, групирани в глави и раздели.Структурните метаданни кодират тази йерархия и свързват всеки логически възел със специфичните файлове, които го представляват.
Нещо подобно се случва и в аудиовизуалните медии: Един полеви запис може да включва множество аудио записи, свързани снимки, текстови преписи и полеви бележки.Структурните метаданни определят връзката между всички тези файлове, предпочитания ред на възпроизвеждане и възможните пътища за навигация.
Типичните елементи на тази категория включват:
- Йерархична информация: глави, раздели, страници, сцени, действия и др.
- Връзки между обектикое изображение е включено в кой ръкопис, кои субтитри съответстват на кой видеозапис, коя версия е производна от коя.
- Ред или последователност: номер на страница, позиция в списък, логически или хронологичен ред.
- Индекси, съдържание и отметки които улесняват фината навигация през обекта.
В METS ключовата част, посветена на това, е Структурна карта ( ), която определя йерархична структура от подразделения ( ) свързани с файловете, декларирани по-горе в секцията с файлове ( ). Освен това има раздел от Структурни връзки ( ) което ви позволява да регистрирате хипервръзки между части от структурната карта, нещо много полезно при архивиране на уебсайтове или ресурси със сложна навигация.
Благодарение на тези метаданни, Интерфейсите могат автоматично да реконструират съгласуван изглед на сложен дигитален обект (книга, интервю, уебсайт, мултимедийна колекция) и предлагат на потребителя интуитивна навигация, без да се налага да се притеснява кой конкретен файл се крие зад всеки фрагмент.
Стандартът METS като пример за интеграция на метаданни
За да видите как всички тези части се съчетават в реален случай, си струва да разгледате METS (Стандарт за кодиране и предаване на метаданни), XML-базирана схема, предназначена за кодират, обменят и запазват сложни цифрови обекти в библиотеки и хранилища.
Пълен документ на METS Състои се от няколко отделни секции които разговарят помежду си:
- Заглавка на METS ( ): съдържа основни метаданни за самия METS документ (дати на създаване и промяна, статус на записа, агенти, участващи в жизнения му цикъл, и техните роли и др.).
- Раздел с описателни метаданни ( )Можете да включите вътрешни описателни метаданни (вграден XML) или препратки към външни описания (напр. MARC запис или EAD документ), или и двете.
- Раздел за административни метаданни ( ): е подразделен на , , и , където се записват технически, авторски, произходни и цифрови метаданни.
- Раздел „Файлове“ ( ): декларира всички файлове, които са част от цифровия обект, групирани в които могат да представляват различни версии (основна, производна, миниатюри, преписи и др.).
- Структурна карта ( ): установява логическата или физическата йерархия на обекта (напр. книга > глава > страница) и свързва всяко подразделение със съответните файлове, използвайки указатели ( ) и области ( ) за фина настройка на това коя част от файла е свързана с всеки раздел.
- Структурни връзки ( )Те записват хипервръзки между различните части на структурната карта, използвайки елементи и препратки, базирани на идентификатор.
- Раздел за поведение ( ): позволява свързването на изпълним код или услуги (напр. уеб услуги) с определено съдържание, като се задава интерфейс и механизъм, който реализира поведението.
С този дизайн, METS Позволява изразяване на сложни връзки между описателни, административни и структурни метаданнив допълнение към свързването им с услуги за представяне или обработка. Ето защо той често се използва като пакет за изпращане, архивиране или излъчване (SIP, AIP, DIP) в контекста на OAIS модела за цифрово съхранение.
Други ключови видове метаданни в професионалната практика
Въпреки че фокусът обикновено е върху описателни, административни и структурни аспекти, съвременното управление на информацията включва други видове метаданни, които обогатяват изгледа на данните и да се даде възможност за нови аналитични, защитни и потребителски приложения.
Метаданни за процеса
Метаданни за процеса Те документират как данните са били създавани, трансформирани или анализирани през целия им жизнен цикъл.Те са от съществено значение в изследванията, анализа на данни, машинното обучение и среди, където се изисква възпроизводимост.
Типични примери биха били:
- История на версиите и редакциите, като се посочва кой е направил каква промяна и кога.
- Описание на стъпките на лечение (събиране, почистване, стандартизация, филтриране, агрегиране…).
- Приложени трансформации (конвертиране на формати, компресии, изрязване на аудио или видео и др.).
- Софтуер, библиотеки и версии използвани при обработката.
- Настройки на алгоритми или инструменти.
- Оригинални източници на данни и производни между наборите от данни.
Тази информация позволява Повторете или одитирайте работен процес, открийте грешки и валидирайте резултатите, нещо критично в научния и бизнес контекст, основан на данни.
Метаданни за употреба
Метаданните за употреба се фокусират върху как и в колко се използват ресурситекой го използва, колко често, откъде, с каква цел и т.н.
Сред най-често срещаните данни откриваме:
- Брой достъпи или преглеждания на ресурс.
- Потребители или профили които са консултирали или променили съдържанието.
- Дати и часове на последните достъпи или изтегляния.
- Контексти на употреба (например, ако е било използвано в обучението, във вътрешен доклад, в маркетингова кампания...).
Тези метаданни се използват за оптимизиране на колекции, приоритизиране на съхранението, откриване на критично съдържание или измерване на въздействието на определени ресурси, в допълнение към системи за препоръки за хранене и анализ на поведението.
Метаданни за местоположение: географски и времеви
Метаданни за местоположението Те добавят пространствен и времеви контекст към данните., нещо от решаващо значение в географската информация, сензорните записи, снимките, видеоклиповете или поведенческия анализ.
Обикновено се разграничават две основни групи:
- Географски метаданникоординати (географска ширина и дължина), референтна система (напр. WGS84), надморска височина, административни единици (държава, регион, град), точност на местоположението, маршрути или пътеки, съответна топографска информация.
- Временни метаданни: дати и часове на създаване, изменение и публикуване, периоди на валидност, времеви интервали, обхванати от данните, честота на актуализиране и др.
Този слой информация прави възможно Разширени пространствени и времеви заявки, анализ на мобилността, еволюционни изследвания и пространствено-времеви корелациии е стълб на географските информационни системи (ГИС).
Социални метаданни
Онлайн платформите и социалните медии са много важни социални метаданни, които описват взаимодействията, ангажираността и приемането на съдържание.
Те включват, например:
- Коментари, бележки и дискусии свързан с даден ресурс.
- Брой „харесвания“, харесвания или реакции.
- Брой пъти, в които дадено съдържание е било споделяно и на кои платформи.
- Абонати или последователи на създателя.
- Оценки и отзиви предоставени от общността.
- Генерирани от потребителя етикети (фолксономии), които допълват контролираните речници.
Тези метаданни предоставят социално измерение и популярност което може да повлияе на приоритизирането на съдържанието, стратегиите за разпространение и откриването на тенденции.
Метаданни за сигурност
Метаданните за сигурност се събират всичко, свързано със защитата, контрола на достъпа, одита и класификацията на чувствителността на информациятаВ организации със зряла стратегия за киберсигурност, тези метаданни са частта, която активира политики за криптиране, сигурно изтриване, контрол на копирането и др.
Сред най-често срещаните елементи са:
- Нива на достъп и разрешения (само за четене, редактиране, изтриване, споделяне…).
- Роли и отговорности на потребители и групи.
- Географски или мрежови ограничения за достъп.
- Информация за криптиранеалгоритми, ключове, състояние на криптиране.
- Цифрови подписи за да се провери автентичността и целостта.
- одитни пътеки с кого, кога и как е бил осъществен достъп до даден ресурс или е бил променен.
- Нива на чувствителност или класификация (публична, вътрешна, поверителна, секретна и др.).
- Политики за пароли и многофакторно удостоверяване свързани с достъпа.
- Време за съхранение и унищожаване в зависимост от законови или корпоративни изисквания.
В комбинация с автоматизирани аналитични механизми, тези метаданни позволяват откриване на критични документи, предотвратяване на изтичане на информация и демонстриране на съответствие по време на одитиособено когато обемът на файловете далеч надвишава капацитета за ръчно управление.
Метаданни и управление на данни в организациите
В корпоративната среда метаданните са основата на добра стратегия за управление на данни и управление на даннитеБез ясен модел на метаданни, организациите губят представа за това каква информация имат, къде се намира тя, кой я използва и какви са свързаните с нея рискове.
Чрез интегриране на описателни, административни, структурни и защитни метаданни е възможно:
- Улесняване на откриването и ефективното търсене информация в цялата организация.
- Осигурете правилното тълкуване на данните, благодарение на контекста, дефинициите и документацията на източника и процеса.
- Контролни версии и промени чрез истории на процесите и метаданни.
- Прилагане на правила за съхранение, изтриване и достъп съобразено с разпоредбите и с бизнеса.
- Внедряване на автоматизация на сигурността подкрепено от класификация на чувствителността и метаданни за права и употреба.
- Оптимизирайте производителността избор на подходящи формати и структури въз основа на технически метаданни.
Традиционните инструменти, базирани на електронни таблици или ръчно сортиране, се оказаха недостатъчни: Те не се мащабират добре, склонни са към грешки и рядко предлагат глобален поглед върху информационната екосистема.Съвременните платформи, базирани на изкуствен интелект, използват съществуващите метаданни и генерират нови метаданни за класифициране в мащаб, идентифициране на рискове, картографиране на лични данни и автоматизиране на контрола за сигурност и съответствие.
В крайна сметка, Описателните, административните и структурните метаданни действат като гръбнак, върху който се базират останалите слоеве метаданни. и да позволят на данните да престанат да бъдат просто хранилище за файлове и да се превърнат в стратегически, управляем, сигурен и наистина използваем актив при вземането на решения.
Страстен писател за света на байтовете и технологиите като цяло. Обичам да споделям знанията си чрез писане и това е, което ще направя в този блог, ще ви покажа всички най-интересни неща за джаджи, софтуер, хардуер, технологични тенденции и много други. Моята цел е да ви помогна да се ориентирате в дигиталния свят по лесен и забавен начин.
