ちょっとしたメモ

RDF Validator多国語対応が改善

W3CのRDF Validatorによる多国語の図形描画が、ようやくうまく行くようになった模様。Olivier Thereauxのメールによれば、We have managed to make the graphing tool use a font covering a very hight number of scripts. ということで、実際、要素内容だけでなく要素型名に日本語を用いたRDFもうまく図形表示できている。2年以上かかってしまったわけだが、これでまともにValidatorが使えるようになった。

依然として、パースと検証はできるものの描画エラーになるケースもある。いくつかチェックしていて、リテラルに二重引用符(")が含まれるとうまく行かないことが判明した。

  • マッチする二重引用符の中身はグラフには描画されない
  • マッチしない二重引用符があると描画エラーになる
  • 二重引用符内に記号(:./#?など)があると描画エラーになる

挙動から推測すると、Graphviz用のdotファイル生成時に引用符のエスケープをきちんとしていないために、引用符内のテキストをdotのラベルと解釈してしまい、ラベルとして不正な場合にエラーを起こしているような感じだ。画像サイズが非常に大きくなるデータもやはり描画不能だが、小さなRDFなのにエラーになるときは、リテラルノードを確認してみるといいかもしれない。

それでも、小さな問題は残っているとはいえ、RDF Validatorで日本語を含むグラフ描画ができるようになったことは喜ばしい。

関連メモ:
genre: rdf. at