« 日本古典籍総合目録 | トップページ | 算賀(1)主催者と被算者 »

2007年1月21日 (日)

古事類苑検索試験システム

『古事類苑』という本をご存知でしょうか。
今からほぼ100年前、20世紀初頭に編纂された日本最大の百科事典です。
といっても、私達が普通イメージする百科事典とは少々編纂の仕方が違っており、それぞれの項目についての記述の大部分は各時代の文献から抜粋された引用文で、それらを細分類した見出しの下に時代順に配列する形式を取っています。
採録されている文献は、歴史書や有職故実書、その分野の専門的な書物から、日記や物語などまで幅広く、生の史料記述そのものを読み込まなければいけない手間はかかるものの、目を配るべき文献をこれ1冊で一網打尽にできるのが最大のメリットです。
また、項目の配列も私達が馴染んでいる百科事典のような五十音順ではなく、天部・歳時部・地部・神祇部…と主題別になっており、研究者の間では日本古典学の知識体系を網羅した百科事典としてこの分類も注目されています。

30の部と総目録・索引から編成され、洋装本で51冊ないし60冊から成る『古事類苑』
個人で所蔵するのはとても無理なこの本もまた、現在電子化してインターネットで全文を公開しようとの試みが始まっています。

古事類苑検索試験システム

現在進行形のプロジェクトで、試験公開も去年から始まったばかりのようですが、一部データの試験公開とはいえ、このプロジェクトのすごさは実際にリンク先に飛んでいただければ説明不要かと思います。
『古事類苑』がWeb上で閲覧できる、という自体も充分すごいことですけれど、もっとすごいのは本文がテキストデータで表示されること。
インターネット・エクスプローラでページを読み込むと、ルビや返り点なども含め本文がHTML形式のまま縦書き表示されます。
(FirefoxなどNN系のブラウザには対応していません)
同時に、画面右上に表示される[画像]ボタンをクリックすると、JPEG形式のページ画像も閲覧できます。
画像だけでなくテキストで本文が読めることは、画像を読み込む手間が省けるとかコピー&ペーストが使えるとか、いろいろ利点がありますが、一番大きいのは本文の検索が可能になるという点だと思います。
現在の試験システムでは、目次と五十音順索引から該当ページへジャンプする機能が提供されているだけですが(勿論これだって、書籍版を1ページずつめくることを考えたらものすごく便利な機能ですけれど)、将来的には全文検索も可能になるに違いない!と勝手に期待しています。

プロジェクトの紹介・進捗状況などは、このプロジェクトの中心になっている国際日本文化研究センター助教授・山田奨治氏の研究室Webサイトに掲載されています。
国際日本文化研究センター・山田奨治研究室>Data Mining for the Humanities>電子化古事類苑プロジェクト
このページの情報によると、既にページ画像のデジタル化は完了し、テキストの入力・校正を順次進めているとのこと。
今後どのように進展していくか、大注目のプロジェクトです。

日本ブログ村のランキングに参加しています。よろしければクリックをお願いいたします。
 にほんブログ村 本ブログへ にほんブログ村 歴史ブログへ

|

« 日本古典籍総合目録 | トップページ | 算賀(1)主催者と被算者 »

資料紹介」カテゴリの記事

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/113097/13588626

この記事へのトラックバック一覧です: 古事類苑検索試験システム:

« 日本古典籍総合目録 | トップページ | 算賀(1)主催者と被算者 »