• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

大規模テキストから自動獲得した知識に基づく言語解析の精度向上

研究課題

研究課題/領域番号 21700163
研究機関京都大学

研究代表者

柴田 知秀  京都大学, 情報学研究科, 助教 (70452315)

研究期間 (年度) 2009-04-01 – 2013-03-31
キーワード自然言語処理 / 大規模テキスト / 知識獲得 / 同義語 / 分布類似度
研究概要

形態素解析用辞書、国語辞典、シソーラス、格フレーム、Wikipediaなど、日本語に関する様々な語彙知識を統一的に語彙データベースとして管理する枠組みを構築した。語彙知識はエントリ単位でXMLフォーマットにて記述されており、定義文、読み、上位語などの属性を記述することができる。また、日本語の処理で問題となる単語区切りについても、語彙データベース内で管理し、また、各エントリに代表表記を付与することにより、表記の揺れ(例: コンピュータグラフィックス = コンピューターグラフィクスなど)を解消することができる。これらの枠組みにより、語彙知識の統一的な管理・アクセスを可能とした。
そして、日本語文の最も基本的な解析、すなわち形態素解析と句認識の結果に語彙知識を埋め込む枠組みをデザインした。具体的には形態素解析器JUMAN、構文解析器KNPの上で実装した。語彙データベースから形態素解析用辞書と構文解析用辞書を出力し、それぞれを解析器で利用し、また、構文解析や省略解析などの様々な言語解析時に参照することや、検索・翻訳などのアプリケーションでの利用を可能にした。これにより、従来の言語解析システムでは必要であった語彙知識の適当なフォーマット変換などが不要となり、意味解析研究の障害の一つを取り除くことができた。また、語彙知識を省略解析などの言語解析時に利用することにより、改善例を確認することができた。

現在までの達成度 (区分)
理由

24年度が最終年度であるため、記入しない。

今後の研究の推進方策

24年度が最終年度であるため、記入しない。

  • 研究成果

    (2件)

すべて 2012 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (1件)

  • [雑誌論文] Predicate-argument Structure based Textual Entailment Recognition System exploiting Wide-coverage Lexical Knowledge2012

    • 著者名/発表者名
      Tomohide Shibata
    • 雑誌名

      Special Issue of ACM TALIP on RITE (Recognizing Inference in TExt)

      巻: 11 ページ: 16:1-16:23

    • DOI

      10.1145/2382593.2382598

    • 査読あり
  • [学会発表] 日本語語彙知識の統一的・整合的管理のデザイン

    • 著者名/発表者名
      黒橋禎夫
    • 学会等名
      言語処理学会 第19回年次大会
    • 発表場所
      名古屋

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi