Post

WordNet

1. WordNet이란

영어 온라인사전인 WordNet의 약10만개에 이르는 명사가 RDF의 클래스계층에 매핑되어 있다. 이것을 이용하면, 리소스의 주제 등을 공통적인 어휘를 사용하여 기술하는 것이 가능하게 된다.

2. WordNet과 RDF의 클래스

WordNet은, 프린스턴대학 인지과학연구소(Princeton University Cognitive Science Laboratory)의 George A. Miller교수의 지휘하에 1985년에 시작된 프로젝트로서, 영어단어의 어의에, 동의어, 상/하위관계(hypernym/hyponym), 전체/부분관계(holonym/meronym) 등의 요소를 추가하고 전자적으로 이용할 수 있는 단어 의미네트워크를 구축한 것이다.

WordNet 버전 1.6을 토대로, 명사를 RDF의 클래스로 하고 상하관계를 서브클래스로하여 정의한 것이 RDF판 WordNet으로서, 이름공간 http://xmlns.com/wordnet/1.6/ 에 영어단어를 추가함으로써, 클래스를 참조할 수 있다.

3. WordNet클래스에 의한 분류 표현

리소스의 분류 및 테마에는 dc:subject에 의해 키워드를 기술하는 방법이 자주 사용된다. 예를 들면, 어떤 콘서트를 주제로 삼고 있는 페이지의 메타데이터의 경우, 다음과 같이 표현된다.

2015-07-15-wordnet

그러나, 리터럴 타입의 키워드를 사용하여 주제를 기술하는 것은, 상이한 단어를 사용하여 같은 것을 의미하거나 같은 단어를 사용하여 다른 것을 나타내는 등, 속성의 명명과 동일한 문제를 가지고 있다. 해당 주제에 대해서, 날짜 등의 정보를 추가하는 것도 불가능하다.

이와 같은 주제기술에 WordNet클래스를 이용하면, 용어의 혼동 없이 검색이 확실하게 된다. 또한, 해당 주제에 관한 메타데이터도 그래프를 더 확장하여 구조적으로 나타낼 수 있다.

1) RDFAuthor에서 WordNet클래스를 사용

RDFAuthor에서 WordNet클래스를 다루이 위해서는 추가적인 작업이 필요하다. RDF판 WordNet은 10만개에 이르는 클래스를 정의하고 있기 때문에, 이름공간URI에 엑세스하여 모든 클래스들을 포함하는 스키마를 가져오는 것은 비현실적이기 때문이다.

RDF판 WordNet의 경우, 각 클래스의 URI에 엑세스하면 상위개념을 나타내는 클래스의 트리와 하위개념에 대응하는 클래스표현을 포함하는 RDF스키마 형태로 클래스의 정의를 얻을 수 있다.

RDFAuthor에서 WordNet을 이용하기 위해서는, 적당한 클래스의 URI(이 경우에는 http://xmlns.com/wordnet/1.6/Concert)를 스키마란에 입력하고 Import Schema를 한다.

이와 같이 하면, 입력된 클래스와 그것의 상위 및 하위개념에 상응하는 클래스가 Node Types에 리스트로 열거된다.

[출처 및 참고]

  • 시맨틱 웹을 위한 RDF/OWL 입문
This post is licensed under CC BY 4.0 by the author.