• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

和文系資料を対象とした形態素解析辞書の開発

研究課題

研究課題/領域番号 21520492
研究機関大学共同利用機関法人人間文化研究機構国立国語研究所

研究代表者

小木曽 智信  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (20337489)

研究分担者 田中 牧郎  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (90217076)
小椋 秀樹  大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (00321547)
近藤 明日子  大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト特別研究員 (30425722)
キーワード日本語史 / 形態素解析 / コーパス / 中古和文
研究概要

前年度に引き続き、中古和文資料のための形態素解析辞書「中古和文UniDic」の解析精度をさらに向上させ対応する資料を拡大するために、辞書登録語彙と学習用コーパスの充実を行った。約15万語の学習用コーパスを新規追加し、当該コーパスに出現した未知語をすべて辞書データベースに登録したことにより約95%以上という実用的な精度での解析が可能になった。この辞書の見出し語の整備にあたっては、現代語・近代語用のUniDicとの互換性を確保しながら中古語の実態を反映するよう規程を検討しており、これにより通時的な研究を可能にしている。この規程についてマニュアル作成を進めるとともに、言語処理学会第17回年次大会において学会発表を行った。
このように、実用的な段階に達した「中古和文UniDic」について広く周知し利用を促すため、インターネット上で一般公開を行った(2010年10月)。さらに、この辞書を広く研究者に紹介するため日本語学会2010秋季大会においてブース発表を行った。
一方、「中古和文UniDic」を実際に応用した研究としても、当該辞書を用いた総索引の作成システムを開発し、中世の擬古物語「恋路ゆかしき大将」を例として実際に総索引を作成して情報処理学会「じんもんこん2010」において発表した。
これらの研究活動により、実用になる中古和文資料のための形態素解析辞書を開発し広く公開するという当研究の目的は達成されつつあり、この辞書を応用した研究にも予定通り進展している。
当研究の成果の一部である「中古和文を対象とした形態素解析辞書の開発」(情報処理学会研究報告人文科学とコンピュータVol.2010/CH-85、2010年2月)は、情報処理学会「山下記念研究賞」を受賞しており、学会からも高い評価を得ている。

  • 研究成果

    (5件)

すべて 2011 2010 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件) 備考 (1件)

  • [雑誌論文] 「近代文語UniDic」「中古和文UniDic」を利用した総索引作成システムの開発2010

    • 著者名/発表者名
      小木曽智信・須永哲矢
    • 雑誌名

      人文科学とコンピュータシンポジウム論文集 人文工学の可能性~異分野融合による「実質化」の方法~

      巻: 2010(15) ページ: 119-124

    • 査読あり
  • [学会発表] 「中古和文UniDic」における言語単位の設計2011

    • 著者名/発表者名
      小椋秀樹・須永哲矢・小木曽智信・近藤明日子・田中牧郎
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋科学技術大学
    • 年月日
      2011-03-08
  • [学会発表] 「近代文語UniDic」「中古和文UniDic」を利用した総索引作成システムの開発2010

    • 著者名/発表者名
      小木曽智信・須永哲矢
    • 学会等名
      人文科学とコンピュータシンポジウム「じんもんこん2010」(情報処理学会)
    • 発表場所
      東京工業大学大岡山キャンパス
    • 年月日
      2010-12-11
  • [学会発表] 形態素解析辞書「中古和文UniDic」とその活用例2010

    • 著者名/発表者名
      小木曽智信・小椋秀樹・近藤明日子・須永哲矢
    • 学会等名
      日本語学会2010秋季大会
    • 発表場所
      愛知大学豊橋キャンパス
    • 年月日
      2010-10-24
  • [備考]

    • URL

      http://www2.ninjal.ac.jp/lrc/index.php?UniDic

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi