ちょっとしたメモ

セマンティック・ウェブ、あるいはルーズさを生かした構造

Tim Falconerが1月2日に書いた getting the semweb exactly wrong というウェブログの記事と、それを紹介するsemantic-web-mlへの投稿をきっかけに、新年早々メールボックスが騒々しくなっている。似たような話を毎度繰り返すのも疲れるのだが、今回はバーナーズ=リー親分もスレッドに参加してきているので、簡単に紹介しておこう。

Falconerの記事は、おおざっぱにいうとこんな内容だ。

セマンティック・ウェブについては、手の込んだ三段論法だとか、メタデータを標準化/正規化(normalize)、中央集権化してアプリケーション処理しやすくする一方でウェブの自由度を失うもの、といった批判があるが、本来は逆で、セマンティック・ウェブのアプローチは極めて「ルーズな」もの。RDFOWLのいいところは、全然互換性のないデータをうまくつなぎ合わせて、構造を与えられるという働きにある。

話がややこしくなったのは、セマンティック・ウェブの研究には特定分野のオントロジーというテーマが多く、外部から見たらすごく厳密で難しいものに思えたということがあるかも知れない。標準化団体の形式論理信奉者がいろいろ説明しても、あまりうまく理解されないのだろう。大切なポイントは、「ルーズさを生かしつつ構造を与える」(add structure without losing looseness)というところなんだが。

"Web 2.0"とか"folksonomies"といったものがもてはやされているのは、知ったかぶり屋さん達にも分かりやすいからだ。RDFやOWLだって狙いは同じなんだが、これらはどうもアカデミズムや大規模ソフトウェアという分野の専用だと思われてしまっているらしい。

Web 2.0をかついでいる人々も、いずれセマンティック・ウェブが以前直面した壁(その結果、RDF/OWLというアプローチをとった)にぶつかるだろう。「何てこった、このメタデータを活用するのがこんなややこしいなんて。」そして、セマンティック・ウェブは三段論法なんかじゃなくて、「縫い合わせ」だってことを理解するだろう。

しかし、それでは遅すぎるんだ。取っつきやすい、半端なセミ・スタンダードを使って、結局何にもならないという事態にならないうちに、セマンティック・ウェブ技術の利点を理解してもらわなくては。

メーリングリストの議論は、そもそもRDFはデータを"normalize"するものだとか、RDFと関係データベースモデルの長所短所といった話に展開していっているが、セマンティック・ウェブについてFalconerの言う「ウェブのルーズな特徴を生かすもの」だけれども「バラバラなものを縫い合わせて利用可能にするもの」という論点は、押さえておきたい。

"Web 2.0"と喜んでみても、それだけでは壁にぶつかるというのもFalconerの主張するとおりだろう。しかし、"Web 2.0"アプローチの方が受け入れられ易いのならば、そことセマンティック・ウェブを繋ぐブリッジを工夫するのが現実的だ。みんな考えてると思うけどね。

関連メモ:
genre: rdf. at