• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

既存知能を利用した小規模コーパスからの知識獲得

研究課題

研究課題/領域番号 09780308
研究種目

奨励研究(A)

配分区分補助金
研究分野 知能情報学
研究機関茨城大学

研究代表者

新納 浩幸  茨城大学, 工学部, 講師 (10250987)

研究期間 (年度) 1997 – 1998
研究課題ステータス 完了 (1998年度)
配分額 *注記
2,200千円 (直接経費: 2,200千円)
1998年度: 900千円 (直接経費: 900千円)
1997年度: 1,300千円 (直接経費: 1,300千円)
キーワードコーパス / 辞書 / シソーラス / 文書校正 / 同音異義語 / N-gram / 決定リスト / シソ-ラス
研究概要

本研究の目的は,小規模コーパスから言語処理に有用な知識を獲得することである.大規摸コーパスから有用な知識が得られることは解明されてきたが,実際に大規模コーパスを準備することは困難であり,小規模コーパスからどのように知識を抽出するかが現実的な問題としてある.本研究ではこの問題に対し,既存にある知識を併用することを試みている.基本的には既存の辞書やシソーラスが有用である.ただし,それらは人間が利用するために作られたものであり,機械処理には向いていない.そこでまず既存のシソーラス補強することを検討し,成果を論文誌に発表した.
また研究を進めるにあたり,自然言語処理の様々な問題は語義選択問題に帰着されることがわかってきた.そこで,語義選択問題の中でも特に,応用が明確な文書校正に着目した研究を開始した.具体的には,同音異義語の誤り検出に対して決定リストの手法,平仮名列の誤り検出に対してN-gram手法といった統計的な手法を試みた.その結果,これらの誤り検出にもコーパスを利用した統計的な手法が効果的であることを確認した.
さらに情報抽出で必要となる人名などの固有名詞抽出や複合語の単語分割にもコーパスからの規則抽出が有効であるので,既存知識として従来手法の規則ベースの手法を想定し,規則ベースの手法の誤りをコーパスから得られた知識を利用して修正することを試み,その有効性を確認した.

報告書

(2件)
  • 1998 実績報告書
  • 1997 実績報告書
  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] 新納浩幸: "複合語からの証拠に重みをつけた決定リストによる同音異義語判別" 情報処理学会論文誌. 39.12. 3200-3205 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Hiroyuki Shinnou: "Revision of Morphological Analysis Errors Through the Person Name Construction Model" ANLP-98. 399-407 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 池谷昌紀,新納浩幸: "文字ベースのHMMによる複合語単語分割の誤り修正" 言語処理学会第5回年次大会. C4-1, 発表予定. (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 新納浩幸: "コーパスを利用した分類語彙表の未登録語義の発見" 情報処理学会論文誌. 38.5. 965-961 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 新納浩幸: "複合語判定を優先させた決定リストによる同音異義語判定" 情報処理学会自然言語処理研究会. NL-124(発表予定). (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 新納浩幸: "平仮名N-gramによる平仮名の誤り検出とその修正" 言語処理学会第4回年次大会. C4-1(発表予定). (1998)

    • 関連する報告書
      1997 実績報告書

URL: 

公開日: 1997-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi