セマンティック

セマンティック(semantic)とは、コンピュータに情報収集やそれらの関連付けを自動処理させ、より現実に即した理解を促進させる技術のことをいう。

セマンティックとは意味や意味論という言葉に関連する用語である。ウェブの世界で多用されるようになったのは、ウェブ上で利用される様々な技術の標準化を推進するW3Cによってセマンティックwebが提唱されたためである。この団体は、バリデーションを行うためのバリデータというwebアプリケーションを公開している。他にもダイナミックHTMLの混乱から、どのブラウザでも同一のJavaScriptからHTMLドキュメントを制御できるようにDOMを普及させたことで知られる。

web上でいうセマンティックは主にマークアップ言語が用いられる。マークアップ言語とは文章の構造や視覚情報を表すために使われる形式言語のこと。もともとはXML(拡張可能なマーク付け言語)にRDFやOWLといったメタデータを記述するところからセマンティックと呼ばれる概念が用いられるようになったようである。HTML5からはそれまでのHTMLに加えて階層構造が増えたため、更にセマンティックと呼ばれる用語が多用されるようになった。

従来、ウェブを含める文章の検索機能は、単語単位のものであった。これに文章の意味をメタデータに加えることで検索対象の文字列が単語単位ではなく、ひとまとまりの文章としての意味を持つデータとして処理することも可能になった経緯がある。これがオントロジーと呼ばれるものである。

W3Cから誕生した本来のセマンティックとは異なるが、他にもリッチスニペットリッチリザルト)といったセマンティックの応用例もある。リッチスニペットは検索結果でのタイトル下部に表示される数行のスニペットを更に拡張させたものである。スニペットは断片の事で、この場合は数行のテキストを指す。このリッチスニペットは、構造化データマークアップが必要。動画やレシピ、レビュー、イベントなどに対応しているが、全てのウェブページコンテンツが対象となっているわけではない。これもオントロジーの観点からセマンティックといえる。

また、似たような呼び名に強調スニペットというものもあるが、こちらはアルゴリズムの自動化で表示されている。マークアップの指定方法は今のところないようであるが、表示の確率を高める一定の法則は議論されている。強調スニペットとは、検索結果の一位より上に表示される枠組みコンテンツのこと。メタデータの指定方法が無いようなので、厳密にはセマンティックとはいえないようである。

セマンティックwebにおけるSEO効果はリッチスニペットだと露出度が上昇するため、ユニークユーザーアクティブユーザー)やページビューセッション数、CTRなどのトラフィック上昇が考えられる。ただし、限られた分野であるため、それ以外のサイトでは役立たない。他のマークアップに関しては、賛否両論あるようで検証したデータも不明である。ただ、タグ構成が壊れている、タグの論理構造がおかしい、といっただけで問題になることは無いようである。これは、ブラウザが構造エラーをある程度補って出力する傾向であることから、同じ理屈と推測される。

セマンティックの意味を簡潔に説明すると

関連付けた情報をコンピュータに理解させる技術。