메타데이터(Metadata) 개념잡기
출처: http://www.metadata.go.kr/html/intro/metadata.php 외 여기저기
작성: 몽키몽키(cache798@naver.com)
메 타데이터는 일반적으로 ‘데이터에 대한 데이터(data about data)'라고 하며, 대상이 되는 정보 자원의 속성과 특성 및 다른 자원과의 관계를 기술하여, 이용자의 관점에서는 검색을 돕고 관련기관에서는 정보원 제어와 관리를 돕는 역할을 한다.
다시 말해서 메타데이터(metadata)는 실제로 저장하고자 하는 데이터(예를 들면 비디오, 오디오, 텍스트 등)는 아니지만, 이 데이터와 직접적으로 혹은 간접적으로 연관된 정보를 제공하는 데이터를 나타내는 말이다.
이와 같은 메타데이터를 사용하면 사용자가 원하는 데이터가 맞는가를 확인할 수 있고, 쉽고 빠르게 원하는 데이터를 찾아낼 수 있다. 즉, 데이터를 소유하고 있는 측면에서는 관리의 용이성을, 데이터를 사용하고 있는 측면에서는 검색의 용이성을 보장받을 수 있기 때문에 메타데이터의 필요성이 더욱 높아지고 있다.
현재 통일된 하나의 메타데이터 표준은 존재하지 않는다. 이는 다양한 환경과 요구에 맞는 적절한 메타데이터 포맷이 요구되며, 이에 따라 각 분야에서 사용되는 메타데이터 구조도 특정 분야의 요구에 맞게 매우 상세하고 전문적으로 개발되고 있기 때문이다.
오늘날 수십 여종의 메타데이터가 사용되고 있으며, 대표적인 것으로 도서관에서 오래전부터 목록용으로 사용되었던 MARC(Machine Readable Cataloging)가 있으며, 인터넷 상의 전자자원을 기술하기 위한 더블린 코어(Dublin Core) 메타데이터, 온라인 서점과 관련된 ONIX(ONline Information eXchange), 전자도서관을 위한 MODS(Metadata Object Description Schema) 등이 있다. 이밖에도 다양한 메타데이터들이 각각의 목적과 용도에 따라 개발되었고, 또한 개발 중에 있다.
다음과 같이 디지털 카메라의 실례를 통해 메타데이터를 이해해 보자.
디 지털 카메라의 가장 큰 특징 중 하나가 이미지에 메타데이터를 담을 수 있다는 것이다. 메타데이터(Meta Data)는 촬영정보라고 할 수 있는데 데이터베이스를 기반으로 하는 프로그래밍에서 주로 쓰이는 용어로 사전적 의미로는 다른 데이터를 설명하거나 가동시켜 주기 위한 독립적인 데이터이다. 예를 들어 디지털 사전의 해설내용 파일이나 프로그램의 스키마 등을 지칭한다.
디 지털 사진에서는 촬영한 카메라의 종류, 감도, 노출정보, 촬영일시 등 각종 촬영순간의 정보를 이미지와 함께 기록하여 이미지 파일 내부의 일정 부분에 저장 하므로 나중에 이미지에 대한 정확한 정보를 알 수 있게 하고 이를 이용한 키워드 방식의 검색기능과 함께 이미지 데이터베이스와 연계하여 이미지관리를 쉽게 할 수 있는 장점을 제공한다.
이 와 같은 파일포맷을 ‘EXIF(Exchangeable Image File Format)’라고 하며 ‘교환 이미지 파일형식’으로 번역할 수 있다. 즉, 화상데이터와 함께 촬영일 등의 부수적인 텍스트 정보와 축소화상(Thumb nail)이 함께 기록되도록 함으로써 이 정보를 이용하여 효율적인 화상파일 관리가 가능하게 한 것이다.
화 상데이터의 저장방식으로 제이팩(Jpeg)압축방식이 주로 이용되기 때문에 일반 Jpeg포맷에 EXIF기능을 넣은 ExifJpeg를 많이 사용하고 있다. 그러나 이것도 단순히 Jpeg 혹은 Jpg로 표시한다. 지금은 Tiff나 RAW파일에도 대부분 EXIF기능을 첨가하여 사용하고 있다.
EXIF 는 디지털 카메라로 촬영된 이미지를 나중에 포토샵으로 수정을 가하면 그 수정 사실에 대한 정보와 시각 등의 히스토리까지 기록해 둔다. 따라서 원본인지 수정된 이미지인지를 가리는 단서를 제공하므로 오리지널리티를 보장하는 근거로도 활용할 수가 있다. 그러나 일부 편집프로그램으로 의도적인 변경이 가능하므로 신뢰할수 있는 것은 아니다.
Nikon D1X 같은 고급형 디지털 카메라는 GPS(Global Positioning System) 부가장치를 이용하여 전 세계 어디서나 인공위성으로 부터 위치정보를 추출함으로써 촬영장소까지도 자동으로 입력하는 기능을 제공하기도 한다.
메 타데이터는 이미지의 촬영정보를 비교해 볼 수도 있어 카메라의 특성에 따른 정확한 촬영데이터를 산출해 내는 데에도 도움이 된다. 그리고 디지털전용 출력장치나 기타 이미지관련 주변장치 혹은 소프트웨어들에 이미지의 환경정보를 제공함으로써 자동화된 이미지처리 프로세스의 기반이 될 수 있으며 미리 모듈로 만들어 저장해 둔 각 디지털카메라의 설정값을 불러와 최적의 출력물을 얻을 수 있도록 하고 있다.
메타데이터를 보려면 해당 디지털 카메라 전용소프트웨어나 이미지뷰어 프로그램 혹은 포토샵7.0 이후에서 제공하는 파일브라우저 등을 사용하면 된다.
지금까지의 내용을 정리해 보자면 다음과 같다.
한마디로 말해서, 메타데이타는 데이타를 위한 데이타이다. 보통 컴퓨터에서는 메타데이타를 크게 2가지 목적을 위해 사용하고 있다.
하나는 데이타의 표현하기 위한 것이다.
예 를 들어 위의 문장은 굵은 글씨로 글이 쓰여져 있다. "하나는 데이타의 표현하기 위한 것이다."라는 문장은 사용자 입장에서 보면 데이타이다. 그런데 이것을 굵은 글씨로 화면에 보이게 하라 는 것이 어디엔가 데이타로 표현 된다. 이러한 데이타를 메타 데이타라고 한다. 즉 데이타를 꾸미기(?) 위한 데이타라고 할 수 있다.
우 리가 MS-Word나 아래 한글로 타이핑 할 때 글씨를 빨강색으로 보이게도 하고, 또 제곱 글자 처럼 작은 글자로 위로 올라 가게 보이게하기도 한다. 또는 이탤릭 체로 보이게 할 수도 있다. 우리 눈에는 안보이지만 컴퓨터 프로그램은 파일 내 어디엔가 이런 정보를 담아 둔다. 이러한 것을 메타데이타라고 한다.
그러나 메타데이타는 글자의 모양이나 색깔 등을 표현하는 것 이외에도 문장의 제목이나 단락, 혹은 쪽(page), 장(chapter)등을 표현 할 수 도 있다.
메타데이타의 가장 좋은 예는 html 태그이다.
<*font color=red*>,<*b*>,<*h1*>,<*head*>,<*body*>등으로 글자의 색상이나, 문맥 등을 표현 한다. 이러한 html은 또 구조화 되어 있어서 메타데이타를 데이터에 관한 구조화된 데이터 (structured data about data) 라고 부르기도 한다.
구조화의 의미는, html태그내에 head나 body가 있고 body내에는 table이 올 수 있고, table 내에는 tr이, tr내에는 td가 올 수 있는 것처럼 상위에서 하위로 구조(treeㄹ형태)를 이루고 잇다는 의미이다.
메타데이타의 또 다른 역할은 데이타를 찾기 위한 인덱스(Index)구실을 한다는 것이다.
우 리가 책의 내용을 찾을 때 책 앞의 목차나 책 뒤의 색인을 보고 찾으면 빨리 찾을 수 있다. 우리가 많이 사용하는 데이타베이스도 이러한 메타데이타가 잘 구성 되어 있기 때문에 빨리 데이타를 찾을 수 있다. 이 경우, 메타데이타는 데이타를 빨리 찾기 위해 만들어 둔 데이타가 된다.
전자의 경우나 후자의 경우나 메타데이타는 데이타를 사용하는 사람에게는 보이지 않는다. 그러나 기계(컴퓨터)는 메타 데이타를 내용을 이해하고 이용한다.
요약해서 이야기 하면 메타데이타는
(1) 데이타를 꾸미기(?) 위한 데이타
(2) 데이타를 빨리 찾기 위해 만들어 둔 데이타
[출처] 메타데이터(Metadata) 개념잡기|작성자 몽키몽키
파란실버라이트
To remember the time when I started learning Silver Light!