ちょっとしたメモ

metaprofと文書トピックの主語URI

XHTML文書の要素に一定の規則に基づいたクラス属性を与えているとき、文書プロファイルにmetaprofを用いればGRDDLでRDFグラフが簡単に抽出できるようになるが、これまでは文書のトピックにURIを付与することができなかった。これを改良する新しいルールを変換スタイルシート追加したので、とりあえずお知らせを。

従来のmetaprof(の変換スタイルシート)の規則は、ブロックレベル要素に大文字で始まるクラス属性値、もしくはdc.foaf.などの特定の接頭辞をつけたクラス属性値を与えておけば、それを適当なRDFの型付要素に置き換えて、文書のトピックを構成していた。たとえば、

(例)

<p class="foaf.Image">
 <img src="http://..." alt="xxx" />
 <span class="date">2007-10-05</span> by <span class="author">masaka</span>
</p>

といった段落があれば、次のようなRDFが文書のトピックとして生成される。

(例)

<foaf:topic>
 <foaf:Image>
  <dc:date>2007-10-05</dc:date>
  <dc:creator>masaka</dc:creator>
 </foaf:Image>
</foaf:topic>

多くの場合、これでも機能するのだが、このように画像について記述するなら、その画像のURIをfoaf:ImageのURIにしたくなるのは当然だ。そこで、この画像要素にclass="about"を加えると、src属性の値をトピックの主語として抽出するようにした。つまり、

(例)

<p class="foaf.Image">
 <img src="http://..." alt="xxx" class="about" />
 <span class="date">2007-10-05</span> by <span class="author">masaka</span>
</p>

から次のRDFが得られる。

(例)

<foaf:topic>
 <foaf:Image rdf:about="http://...">
  <dc:date>2007-10-05</dc:date>
  <dc:creator>masaka</dc:creator>
 </foaf:Image>
</foaf:topic>

画像要素だけでなく、a要素でもclass="about"があればそのhref属性を主語URIとして採用する。

(例)

<p class="foaf.Document">
 <a href="http://www.kanzaki.com" class="about">The Web KANZAKI</a>を読んでみたら、
 <span class="description">役に立つことがいろいろとが書いてある。</span>…
</p>

というマーク付けをしておけば、

(例)

<foaf:topic>
 <foaf:Document rdf:about="http://www.kanzaki.com">
  <rdfs:label>The Web KANZAKI</rdfs:label>
  <dc:description>役に立つことがいろいろとが書いてある。</dc:description>
 </foaf:Document>
</foaf:topic>

というRDFを取り出すことができる。

最近いくつかのページのマーク付けを見直していて、こうした主語URIが必要なケースは少なくないように思われたので、機能追加します。詳しくはまた別途書くとして、取り急ぎお知らせまで。

関連メモ:
map - genre: rdf. at