• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

受け係り関係を用いた辞書構築システムの開発

Research Project

Project/Area Number 09780315
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionTokyo University of Agriculture and Technology

Principal Investigator

乾 伸雄  東京農工大学, 工学部, 助手 (20236384)

Project Period (FY) 1997 – 1998
Project Status Completed (Fiscal Year 1998)
Budget Amount *help
¥2,100,000 (Direct Cost: ¥2,100,000)
Fiscal Year 1998: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 1997: ¥1,400,000 (Direct Cost: ¥1,400,000)
Keywordsシソーラン / 自然言語 / 辞書 / 係り受け / 形態素 / 意味 / 副詞 / コーパス / シソ-ラス / 自然言語処理 / 形態素解析
Research Abstract

本研究では,受け係り関数を用いて,単語や句のレベルでの意味的なつながりを獲得し,辞書を構築することを目的としている.本年度は,形態素解析の精度を向上すること目的とした,辞書の構築に主眼をおいて,研究開発を行った.昨年度の研究では,コーパスと既存のシソーラスを用いて意味的な分類を行った.特に,従来あまり着目されてこなかった副詞を題材として取り上げた.本年度は,形態素解析の精度を向上することを主眼とする一般的な辞書の構築を中心に研究を実施した.
形態素解析の手法としては,現在主流となっている隠れマルコフモデルを用いる.この手法の有利な点は,頑健性に富む点である.更なる精度の向上のためには,コーパスから有意義な統計情報を獲得することが鍵となる.本研究では,下記の三種類の辞書を構築し,実験を行った.
1 単語分類の階層構造を利用した辞書
2 部分コーパスごとに得られた統計量を総合して得られる辞書
3 多品詞性を考慮した辞書
隠れマルコフモデルを用いた形態素解析においては,形態素レベルあるいは品詞レベルの状態遷移を考慮するのが普通である.1の研究においては,状態の遷移を同時確率で表現し,形態素・品詞階層間の相互作用の有無によって推定する手法を開発した.2ではコーパス間の統計量の差異から真の統計量を推定する手法を開発した.3においては,個々の単語が取り得る品詞による分類を既存の品詞による分類に含めることによって,新たな分類を作成した.これらの手法によって作成した辞書を形態素解析に適用したところ,既存の方法よりも高い精度が得られることを確認した.例えば,3の方法で2連接確率を用いたものは通常の品詞での3連接確率を用いたものよりも高い精度が得られた.
今後の課題として,これらの方法で作成した辞書が形態素解析だけでなく一般的な辞書として有効であることを示すために,構文解析などで実験を行うことを考えている.

Report

(2 results)
  • 1998 Annual Research Report
  • 1997 Annual Research Report
  • Research Products

    (8 results)

All Other

All Publications (8 results)

  • [Publications] 藤本 浩司: "枝分かれ構造を持つ同時確率モデルによる形態素解析" 情報処理学会論文誌. 39-7. 2101-2111 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] 乾伸雄: "コーパス分割を用いた良質な統計量の推定" 情報処理学会全国大会. 57. 3R-7 (1998)

    • Related Report
      1998 Annual Research Report
  • [Publications] Fujimoto K.: "Learning Parameters with Nested Joint Probability Model" Applied Informatics(AI'99). (1999)

    • Related Report
      1998 Annual Research Report
  • [Publications] 乾 伸雄: "多品詞性を考慮した日本語形態素解析" 情報処理学会研究報告. 99-NL-130. 25-32 (1999)

    • Related Report
      1998 Annual Research Report
  • [Publications] 乾 伸雄: "係り受け関係を用いた副詞の分類と分類要素についての実験的評価" 情報処理学会研究会. 97-NL-120. 59-64 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] 乾 伸雄: "Classifying Adverbs based on an Exsting Thesurus Using Corpus" the Natural Language Pacific Rim Symposium. 501-504 (1997)

    • Related Report
      1997 Annual Research Report
  • [Publications] 山口 昌也: "前編集結果を利用した前編集自動化規則の獲得" 情報処理学会論文誌. 39. 17-28 (1998)

    • Related Report
      1997 Annual Research Report
  • [Publications] 藤本 浩司: "枝分かれ構造をもつ同時確率モデルによる形態素解析" 情報処理学会研究会. 98-NL-123. 1-8 (1998)

    • Related Report
      1997 Annual Research Report

URL: 

Published: 1997-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi