• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Nグラムモデルを用いたクラスタ分析による大規模漢字文献分析の基礎的研究

研究課題

研究課題/領域番号 15700215
研究種目

若手研究(B)

配分区分補助金
研究分野 情報図書館学・人文社会情報学
研究機関花園大学

研究代表者

師 茂樹  花園大学, 文学部, 専任講師 (70351294)

研究期間 (年度) 2003 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
3,500千円 (直接経費: 3,500千円)
2005年度: 700千円 (直接経費: 700千円)
2004年度: 800千円 (直接経費: 800千円)
2003年度: 2,000千円 (直接経費: 2,000千円)
キーワードNグラム / クラスタ分析 / テキストデータベース / オントロジ / 漢字仏教文献 / 仮説形成 / 音韻 / デジタルアーカイブ / 確率的言語モデル / 仏教学 / 文字オントロジ / 玄奘訳経論 / 計量文献学 / 文字知識処理
研究概要

本年度は、(1)構築したテキストデータベースの公開に向けた整理、(2)文字オントロジによるNグラム処理ツールの開発、(3)研究の総括(報告書の作成)を目標に、研究を行った。
(1)に関しては、すでに一部のデータを、花園大学のサーバ(http://kura.hanazono.ac.jp/)より公開している。近日中に、すべてを公開する予定である。
(2)に関しては、当面の目標として漢字の音韻によるNグラム処理を実現するべく『韻鏡』のデータベース化に着手し、完成には至っていないが、準備作業はほぼ終えた。今後、これを完成させるべく、研究・開発を継続する予定である。ただし、音韻のオントロジ記述に関しては、音韻自体が持つ構造の複雑さから、最終的にどのようなモデルでデータベースを構築し、処理すべきなのかを、他の研究者と共同で検討中である。
(3)については、仏教学、人文情報学、自然言語処理研究などの広い視点から、本研究がどのように位置づけられるかについて研究を行い、論文として発表した(下記「「デジタルアーカイブ」とはどのような行為なのか」「仏教学における自然言語処理」参照)。また、本研究で開発した方法を他の文献に応用した研究も行い、成果をあげることができた(下記「楞厳経惟〓疏の逸文をめぐる二、三の問題」参照)。以上のことから考えても、本研究は(一部、未達成の部分が残っているとは言え)今後の古典学研究に活用されうると思われるし、期間内に十分な成果をあげたと考えられる。
以上の成果を含めた本研究全体のまとめとして、現在、報告書を作成しており、近日中に公開予定である。

報告書

(3件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (12件)

すべて 2005 2004 その他

すべて 雑誌論文 (7件) 図書 (1件) 文献書誌 (4件)

  • [雑誌論文] 「デジタルアーカイブ」とはどのような行為なのか2005

    • 著者名/発表者名
      師 茂樹
    • 雑誌名

      情報処理学会研究報告 Vol.2005, No.51

      ページ: 31-37

    • NAID

      110002949240

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 楞厳経惟〓疏の逸文をめぐる二、三の問題2005

    • 著者名/発表者名
      師 茂樹
    • 雑誌名

      禪學研究 特別号

      ページ: 221-234

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 仏教学における自然言語処理2005

    • 著者名/発表者名
      師 茂樹
    • 雑誌名

      漢字文献情報処理研究 6

      ページ: 110-115

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 大規模仏教文献群に対する確率統計的分析の試み2005

    • 著者名/発表者名
      師茂樹
    • 雑誌名

      中國宗教文獻研究國際シンポジウム報告書

      ページ: 357-369

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 文字素性に基づく文字処理2004

    • 著者名/発表者名
      守岡知彦, 師茂樹
    • 雑誌名

      情報処理学会研究報告 Vol.2004,No.58(2004-CH-62)

      ページ: 53-60

    • NAID

      110002911112

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 思想史としての文字情報処理:問題提起として2004

    • 著者名/発表者名
      師茂樹
    • 雑誌名

      シンポジウム「文字情報処理のフロンティア:過去・現在・未来」予稿集

      ページ: 1-7

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] NGSM結果のばねモデルによる視覚化2004

    • 著者名/発表者名
      師茂樹
    • 雑誌名

      漢字文献情報処理研究 5

      ページ: 102-107

    • 関連する報告書
      2004 実績報告書
  • [図書] インド哲学仏教学への誘い2005

    • 著者名/発表者名
      菅沼晃博士古稀記念論文集刊行会
    • 総ページ数
      327
    • 出版者
      大東出版社
    • 関連する報告書
      2004 実績報告書
  • [文献書誌] 師 茂樹: "Perl/CHISEによる正規表現の拡張の試み -文字素性による後方参照の実装実験と課題-"『Linux Conference抄録集』,http://lc.linux.or.jp/paper/lc2003/, ISSN 1348-7876. 第1巻(オンライン論文集). (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 師 茂樹: "Nグラムと文字データベースによる漢字仏教文献の分析"情報処理学会研究報告. 2004-CH-61. 13-18 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 師 茂樹: "Surface on Essence : Beyond the Coded Character Set Model"「書体・組版ワークショップ」報告書(京都大學21世紀COE東アジア世界の人文情報學研究教育據點). 26-35 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 師 茂樹: "Unicodeのcharacter概念に関する一考察"東洋学へのコンピュータ利用 第15回研究セミナー. 3-8 (2004)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi