メタ情報とセマンティック・ウェブ
This page is the table of contents of "The Intruduction to Metadata and Semantic Web". Most parts are written in Japanese, but everybody is welcome.
ウェブは人間が読むための「文書のウェブ」から、様々なデータを自在に発見して利用できる「データのウェブ」へと向かいます。セマンティック・ウェブと呼ばれる分野では、このデータのウェブを実現するために、表現のモデルや交換・共有を可能にするオントロジー、そして推論や頼性検証といった各レベルでの技術開発が進められています。メタデータを適切に与えることで、文書情報をこの「データのウェブ」に組み込むことが可能になります。
- RDFグラフとリンクするデータ
- リソースとメタデータの表現
- 語彙とオントロジー
- メタデータの応用と提供
- そのほか
- ★最近の関連情報 (2022-05-13)
RDFグラフとリンクするデータ
- Linked Data(説明スライドから)
- 連携するデータ、リンクするデータ (2007)
- リンクするデータ、未来へのリンク (2011)
- 日本十進分類とリンクするデータ(2016)の4原則アニメーション
- RDFグラフの視覚化(各構文のRDFデータを円と矢印の図に変換)
- Linked Data Browser(大きめのRDFデータを入れ子テーブルで整理)
- ジャパンサーチ非公式サポート (ツールの使い方、エンドポイント留意点、ジャパンサーチ名鑑(正規化名索引)、MAL統合クエリ、Web Annotationとの組合せなど)
- Image annotator (Web Annotationによる画像注釈やIIIFマニフェストを利用した画像コレクション表示の試み)
Linked First Folio (ボドリアン図書館シェイクスピア・サイトのTEI/XMLデータとデジタル画像を結びつける試み)
リソースとメタデータの表現
- ごく簡単なRDFの説明 できるだけ分かりやすくコンパクトに説明したスライド資料 (2014)
語彙とオントロジー
メタデータの応用と提供
- メタデータによる知人ネットワークの表現:FOAF
(例)
- 写真/画像とメタデータ (暫定公開)
- 位置に関するメタデータとその応用
- FOAFとRSSを用いた画像メタデータ
- イベント情報の公開と活用:RDFカレンダー
- サイト情報の要約と公開:RSS
- ライセンス記述の新しい形:Creative Commonsのメタデータ
- 利用者側プロファイルの提供:CC/PPとUAProf
- プライバシーに関するメタデータ:P3P(とりあえず例)
そのほか
- セマンティック・ウェブに関連してお話ししたときのXHTMLスライド集
- ちょっとしたメモ(主に2003~2008のセマンティック・ウェブ黎明期のメモ)
- Instant Metadata - フォームによるメタデータ簡単生成
- および更に簡単ブックマークレット
- Metadata in XHTML - XSLTによるRDFの抽出
- XHTMLからメタデータを自動抽出する
- XHTMLを拡張し、メタデータを直接記述する
- 『RDF/OWL入門』と『セマンティックHTML/XHTML』
- Some experimental works
- 参加しよう(古い断片)
最近の関連情報
planet masakaからセマンティック・ウェブ関連の最新メモ20件を取り出しています。過去の関連メモはRDF on Planet masakaを参照。
2022-05-13
- ジャパンサーチの北海道デジタルミュージアム1854件をRDF化し、SPARQLエンドポイントで公開しました。jpsearch.go.jp/rdf/sparql/easy/?query=SE... RDF化データセット数は143、アイテム数は約2186万、トリプル数は約10億8268万となりました(☞参照) (original post at )
2022-04-17
- @reali_ze SSN Ontologyの§7.4 www.w3.org/TR/vocab-ssn/#SSNProperty-ins... でプロパティは全ての関心対象に共通でも一つの関心対象固有でも構わないとあり、<office/1/temperature>と<office/2/temperature>を使い分ける例が示されてますね。従ってB.4のheightはそれぞれのtreeに固有で良さそうです。失礼しました (original post at )
2022-04-16
- LOD4Culture lod4culture.gsic.uva.es 地図上に世界の文化遺産を表示する。CRAFTSというAPIを使って一定範囲のエンティティをWikidataあたりに問い合わせているようだが、メッシュごとにクエリしているので初期状態の地図では結果表示に30秒~1分も待たされる。むしろLODは実用にならんと思わせてしまうのではという気もする (original post at )
2022-04-15
- @wonox そうですね、RDFに(少なくともndlの)URI記述を含むのでLODではありますが、1MBはなかなか厳しい…施行版では各IDごとに個別RDFを提供する仕組みを用意できず、やや苦肉の策でした。ちなみにw3idのisilはWikidataで用いられていますが、公式リゾルバというわけでもなく、位置づけが微妙な感じです (original post at )
- w3idのisil/JP-はid.ndl.../vocab/isil/JP-に解決(転送)されるのですが、NDL提供のISILのRDFは上3桁ごとに1つの静的ファイルにまとめられているため、該当するIDを含むファイル全体を返すようになっているのです。cf. www.ndl.go.jp/jp/dlib/standards/opendata... (ただしRDFの主語URIはw3id..ではなくid.ndl..です) twitter.com/wonox/status/151488512016282... (original post at )
2022-04-06
- Image annotatorでもNDL OCR x IIIFをスムーズに扱えるよう調整(大量の注釈を表示すると異常に時間がかかっていた問題を解消) www.kanzaki.com/works/2016/pub/image-ann... ただIIIF v3なのに'@'付きidが使われたり、Search APIの結果JSONでtypeやxywhが変則的だったりして特殊処理が必要だった… twitter.com/blue0620/status/151094056256...(☞参照) (original post at )
- IIIFのid属性が2種類あることによる潜在バグが発覚し闇が深い。とりあえずクリアしたが更に見直しが必要 :-((☞参照) (original post at )
2022-03-30
- サーキット3+体幹+ラン30分(228Kcal、3.68Km)。読み物はTheAtlanticからImagine Saturn Without Its Rings 土星の輪は実は太陽光線などで分解されわずかずつ「輪の雨」となっており3億年ほどで消滅するのだという。その古さも太陽系と同じと思われていたがボイジャーの探索結果からせいぜい1億年と推定されるのだと。宇宙もいろいろ姿を変えている (original post at )
2022-03-26
- 漢字を含んだpurlが生き返っているので、削除してしまっていた唐詩/漢字LODを復活させた。ぼちぼち訳も再開したい(☞参照) (original post at )
2022-03-24
- @cm3 ごめん、FILTERで1km範囲内に絞り込みですね。読み違えてました(Quantityのlower/upperBoundに目が行っていたのでそれが自動的に使われるのかと不思議に思っていた)。久しぶりにWikidataのモデルをじっくり見て面白かったです。ありがとうございました (original post at )
2022-03-23
- サーキット3+体幹+ラン30分(223Kcal、3.63Km)。読み物はNY TimesからThe Philharmonic Plans Its Return to Geffen Hall, With Fanfare リンカーンセンターのデイヴィッド・ゲフィン・ホール(2015年にエイヴリー・フィッシャー・ホールから名称変更したらしい)が予定より早く今年10月に改修を終え、NYフィルも来シーズンから本拠地に戻ってくると。ワインヤード型座席配置にしたということで、あのpartial view廉価席はもうなくなるのかな。懐かしい (original post at )
- @cm3 単位との構造化だけでなく正規化値を加えて、さらに正規化値用名前空間psv:まで導入してるのは知りませんでした www.mediawiki.org/wiki/Wikibase/Indexing... クエリ結果を見ると、正規化値が同じでも元の値はけっこうばらついてますね。検索しやすいようにわざと丸めている?? (original post at )
- なるほど確かにP1082(人口)の値もxsd:decimal(FILTERでの比較演算では吸収されるからいいとしても)。Wikidataのデータ型においては数値は一括でQuantityなので、RDF表現では必然的にxsd:decimalということかな www.wikidata.org/wiki/Help:Data_type twitter.com/cm3/status/1506487106931400706 (original post at )
2022-03-17
- G2GML: Graph to Graph Mapping Language for Bridging RDF and Property Graphs arxiv.org/abs/2203.06393 RDFグラフをPGに変換するためにSPAQRLを応用したマッピング言語G2GMLとPGの標準交換記述形式(テキスト型/JSON型)を提案。WikidataやDBpediaの変換例も。ISWC 2020での発表論文プレプリントを公開したもの。変換ツールは github.com/g2glab/pg テストサイトは purl.org/g2gml (original post at )
2022-03-16
- The Vehicle Signal Ontology (VSSo) github.com/w3c/vsso based on COVESA VSS and making use of the SOSA/SSN modeling patterns 次世代カーの車両情報端末IVIで用いるVehicle APIのデータ標準らしい。車両情報サービス(Vehicle Information Service=VIS)仕様と並んでW3CのAutomotive WGで策定作業が進められている。ML経由 lists.w3.org...www-archive/2022Mar/0005.... (original post at )
2022-02-25
- ジャパンサーチの東京ミュージアムコレクションをRDF化し、SPARQLエンドポイントで公開しました。東京都美術館、現代美術館、写真美術館、庭園美術館、江戸東京博物館、たてもの園からの56444件をタイプ別、年度別、分類別ほか多様な切り口で集約するなど利活用できます。jpsearch.go.jp/rdf/sparql/easy/?query=SE...(☞参照) (original post at )
2022-02-21
- Referential transparency and opacity lists.w3.org...public-rdf-star/2022Feb/0... あるRDF文Aについての情報を記述するRDF-starのような形で、(1)対象となる文Aの内容に関する情報は「透明」で、(2)トリプルそのものが対象なら「不透明」という考え方(Selective referential transparency):Aに"1520"^^xsd:integerとあるときに(1)なら"001520"^^xsd:integerを推論しても構わないが、(2)は異なるトリプルになるので不可だと。このためにtransparency-enabling property (TEP)なるものが導入されているが、それを糖衣構文で表現するというスレッドらしい(たぶん)(☞参照) (original post at )
2022-02-18
- ジャパンサーチの広島修道大学デジタルアーカイブをRDF化し、SPARQLエンドポイントで公開しました。jpsearch.go.jp/rdf/sparql/easy/?query=SE... すべてIIIFマニフェストが提供されています(☞参照) (original post at )
- 新マッピングやらchname修正やら突然出現したIIIFのコレクション生成やら (original post at )
2022-02-14
- お知らせ忘れてましたが、学習指導要領LODの階層構造部分をジャパンサーチSPARQLエンドポイントに取り込み、小学校6年社会科の「我が国の歴史上の主な事象に関する内容」各項目に正規化人物名とキーワードを付与してみました。これを用いて指導要領からJPSを検索できます jpsearch.go.jp/rdf/sparql/easy/?query=SE... twitter.com/tmasao/status/14930440338157... (original post at )