Semantic Web と HTML 5

Semantic Web と HTML 5

What – HTML 5 とは

HTML 5のマークアップ言語 Hyper Text Markup Language の5回目のメジャーアップデート版。
HTML 4及びXHTML 2.0との大きな違いは2つ

  • Outline 生成の仕組み
  • Sectioning Contents の理解

Why – HTML 5

人とコンピューターの文章理解をより高めるため

人は文章の意味を段落や接続詞の文脈やフォントのサイズや書体などの視覚的な情報から総合的に判断することができるが、まだコンピューターは文章を理解出来ないとされている。そこで、見出し(h1 – h6)を適切に振ることによって、題名、章立て、段落などの構造を明確化しデータを整理していたが、一体その見出しが文章のどこまでかかっているのかをコンピューター判断するには曖昧で、精度を上げるには、文書体系を整理しより因果関係を明確にする必要があった。

How – Semantic Web と Ontology

Webコンテンツに付与されたメタデータ(意味情報)と、それらの言葉の意味の関連付けによって、Webページ間で関係性の高い情報を返したり、ユーザーが要望する結果を返したりできるようになる。人が書き出す直接記述情報が何に関する情報なのかを示すメタデータを明確に付与することが必要。

Semanticとは

「意味」や「意味論」に関することを指す語で「意味的な」、「意味論的な」と翻訳する

コンピュータに文書や情報の持つ意味を正確に解釈させ、文書の関連付けや情報収集などの処理を自動的に行わせる技術について用られる語である。

Web上でセマンティック技術の実現を図る構想として、Webページ間で意味に即したデータ交換などを行う「セマンティックWeb」や、Web検索において意味的に正確な検索を行う「セマンティック検索」などがある。具体的な実現方法として、文書に関するメタデータの追加、オントロジーを利用した概念の区分の導入、という2点が主に行われる。
「IT用語辞典バイナリ」より引用

Semantic Webとは

Webサイト –(中略)– 情報の意味(Semantics)をコンピュータ自身に理解させることで、人を仲立ちさせることなく情報のやりとりを行わせることができる。WWW関連技術の創始者であるティム・バーナーズ・リーによって提唱された。
「IT用語辞典バイナリ」より引用

現状ではコンピューターはWebサイトへのアクセスと文書情報などのレンダリングツールとして働いているが、まだ人が直接情報を読んで指示(操作)を行っている。この役割もコンピューター自身がWebサイトの情報を解釈して自ら処理を行うことが可能になり、データの意味やデータ間の関連を定義できるようになる。
方法として、XMLをベースとしたメタデータを使用し、メタデータを記述するためのフレームワークをRDF(Resource Description Framework)という。

Semantic Searchとは

ユーザーが何を求めて検索しているのかという意味をコンピューターが理解し、それに即した検索結果を提供する概念または、一連の技術のこと。この仕組を日々進歩で向上させているのがGoogleやBing。

つづく