• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1998 年度 実績報告書

コーパスからの専門用語の自動抽出と知識獲得のため統合的なツールシステムの開発

研究課題

研究課題/領域番号 08558027
研究機関東京大学

研究代表者

辻井 潤一  東京大学, 大学院・理学系研究科, 教授 (20026313)

研究分担者 清野 正樹  松下電器, 東京研究所, 研究員
池原 悟  鳥取大学, 工学部, 教授 (70283968)
影浦 峡  学術情報センター, 助教授 (00211152)
小山 照夫  学術情報センター, 教授 (80124410)
キーワード専門用語 / オントロジー / 係り受け解析 / 分布モデル / コーパス / 知識獲得 / 自動抽出
研究概要

分野依存性の高い言語では、分野依存性の高い語彙的要素.(専門用語)の未知語の問題という言語の工学的処理の問題がある。それに対して、既存の専門用語集合(農業分野、計算機科学、物理学、心理学)に見られる構造を利用して、未知の専門用語が持つ性質・その範囲を理論的に予測するという観点に基づき、専門用語の成長を数理的に予測する研究を行った。すなわち、専門用語の多くは複合単位であるという点、及び語彙的語構成の計量的構造は異なりレベルで現れるという点を考慮し、語基の分布モデルに基づく補間・補外の手法を用いて、専門用語の成長に従う色々なタイプの語基の出現を数理的に予測する手法を開発した。また、専門用語は主に名詞(句)からなり、その構造の解析も必要である。その点に関して、名詞句の意味的な係り受け知識を自動獲得する方法に関する研究(名詞句10000件、内学習用9000件、テスト用1000件)、名詞間係り受け解析に必要な単語意味属性の組の最適化(名詞句4000件)、「の型名詞句」に対する形容詞の係り先解析(名詞句6000件)を行った。また、具体的な特殊領域への適用例として、「ゲノム分野」や「株式分野」、「工業製品ニュース」のテキスト集合への応用を試みた。具体的には、ゲノム論文に対し、既存のshallow parserの出力をもとに、正規表現を用いて名詞句を求め、さらにタンパク質に特異的なイベントを表す動詞の主語と目的語を求めることで、factを得た。また、「ゲノム分野」(英文393記事)、「株式分野」(英文263記事、和文336記事)「工業製品ニュース」(和文40記事)からの自動的な分野オントロジー(専門用語間の分類構造・全体部分構造・同一性構造)の抽出・管理を行った。

  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] Kageura,K.: "A Statistical Analysis of Morphemes in Japanese Terminology" COLING-ACL'98. 638-645 (1998)

  • [文献書誌] Kageura,K.: "Some Characteristics of Bibliometric Samples" Annals of Japan Society of Library Science. 443. 97-110 (1999)

  • [文献書誌] T.Sekimizu,H.S.Park,J.Tsujii: "Identifying the Interaction between Genes and Gene Products Based on Fruquently Seen Verbs in Medline Abstracts" Genome Informatics. 9. 62-71 (1998)

  • [文献書誌] T.Hishiki,C.Nigel,C.Nobata,T.Ohta,N.Ogata,T.Sekimizu,R.Stener: "Developing NLP tools for Genome Informatics : An Information Extraction perspective" Genome Informatics.

  • [文献書誌] 中井、池原、白井: "「の型名詞句」に対する名詞句間の意味的係り受け規則の自動生成" 電子情報通信学会、NLC研究会、信学技報. NLC98-3. 15-22 (1998)

  • [文献書誌] 緒方 典裕: "型理論に基づいた特定領域テキストからの動的なTaxonomy,Mereology構成" 情報処理学会研究報告. 98-NL-127. 133-140 (1998)

URL: 

公開日: 1999-12-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi