• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

前近代日本の諸概念を対象にした知識発見のためのマイニング資源の開発

研究課題

研究課題/領域番号 16200018
研究機関国際日本文化研究センター

研究代表者

山田 奨治  国際日本文化研究センター, 研究部, 助教授 (20248751)

研究分担者 早川 聞多  国際日本文化研究センター, 文化資料研究企画室, 教授 (10208605)
合庭 惇  国際日本文化研究センター, 文化資料研究企画室, 教授 (20273154)
相田 満  国文学研究資料館, 文学形成研究系, 助手 (00249921)
原 正一郎  国文学研究資料館, 複合領域研究系, 助教授 (50218616)
柴山 守  京都大学, 東南アジア研究所, 教授 (10162645)
キーワードデータマイニング / 古事類苑 / 全文データベース / 古文書 / 知識発見
研究概要

今年度は、(1)『古事類苑』シソーラス辞書のプロトタイプ作成、(2)前近代日本史料の全文テキストデータの作成、(3)知識発見手法の開発と評価を実施した。(1)に関しては、平成16年度に作成した『古事類苑』事項索引(約42,000項目)と50音索引(約64,000項目)をもとに、別途作成した『古事類苑』天部の全文データ(UTF-16、約18万文字)と『古事類苑』全巻の頁画像データ(約67,000頁)をリンクしてWEBブラウザで閲覧できるプロトタイプを作成した。これらの作業により、前近代日本の基礎的な用語集にあたる電子情報の基盤が一応整備されたと考えられる。来年度以後このプロトタイプの評価を実施し、マイニング資源としての有効性を確認する。(2)に関しては、『古事類苑』地部(2)全1,400頁と同(3)の前半700頁の構造情報付きの全文入力が予定通り完了した。ただし、校正は未着手である。また、平成16年度に入力した地部(1)の校正を再校まで実施したものの、外字の同定やUTF-16化にまだ問題を残しており、マイニング資源として活用するのはさらなる校正が必要である。また、前近代用語を補完するために、古文書読解のための基本辞書として定評がある東京堂出版『くずし字用例辞典』の用語・用例を電子化を引き続き実施した。(3)に関しては、国際日本文化研究センターが保有する連歌俳譜データベースをマイニングして、そこから前近代の連想語辞書を作成する実験を引き続き行い、連歌における「ほととぎす」のイメージの時代的な変遷についてあらたな知識発見に成功した。その成果を情報処理学会のシンポジウムで公表するとともに、朝日新聞の文化欄でも成果が報道された。

  • 研究成果

    (4件)

すべて 2005

すべて 雑誌論文 (3件) 図書 (1件)

  • [雑誌論文] 連歌・俳譜DBより抽出した連想語彙ネットワークの解析2005

    • 著者名/発表者名
      岩井茂樹, 山田奨治
    • 雑誌名

      人文科学とコンピュータシンポジウム論文集 2005・21

      ページ: 27-34

  • [雑誌論文] データベース共有におけるデータマッピングの事例的研究2005

    • 著者名/発表者名
      原正一郎, 相田満ほか
    • 雑誌名

      情報処理学会研究報告 255-CH-67

      ページ: 31-38

  • [雑誌論文] 日本文化のオントロジ-『古事類苑』のデータベース化のために-2005

    • 著者名/発表者名
      相田満
    • 雑誌名

      第29回イタリア日本研究学会・日本文学国際共同研究研究集会予稿集

      ページ: 17-19

  • [図書] 情報のみかた2005

    • 著者名/発表者名
      山田奨治
    • 総ページ数
      235
    • 出版者
      弘文堂

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi