• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

コーパスからの専門用語の自動抽出と知識獲得のための統合的なツールシステムの開発

研究課題

研究課題/領域番号 08558027
研究種目

基盤研究(A)

配分区分補助金
応募区分展開研究
研究分野 知能情報学
研究機関東京大学

研究代表者

辻井 潤一  東京大学, 大学院・理学系研究科, 教授 (20026313)

研究分担者 池原 悟  鳥取大学, 工学部, 教授 (70283968)
影浦 峡  学術情報センター, 助教授 (00211152)
小山 照夫  学術情報センター, 教授 (80124410)
清野 正樹  松下電器, 東京研究所, 研究員
研究期間 (年度) 1996 – 1998
研究課題ステータス 完了 (1998年度)
配分額 *注記
13,200千円 (直接経費: 13,200千円)
1998年度: 2,600千円 (直接経費: 2,600千円)
1997年度: 3,200千円 (直接経費: 3,200千円)
1996年度: 7,400千円 (直接経費: 7,400千円)
キーワード知識獲得 / 意味クラス / データベース / 専門用語抽出 / 専門用語 / オントロジー / 係り受け解析 / 分布モデル / コーパス / 自動抽出 / 記号処理プログラム / 言語の統計的処理 / タ-ミノロジー / 知識表現 / 情報検索
研究概要

本プロジェクトでは、テキストからの知識獲得を人間援助の形式で行うためのシステムを構築した。より具体的には、次の3つのシステムである。
1.中央データベース系の設計とその開発:東京大学・辻井研究室で開発中の記号処理用プログラム言語LiLFeSと日本電子化辞書(EDR)で開発されてきたコーパス・データベース、及び、概念辞書データベースとのインターフェースを設計・開発し、獲得された知識とそのもととなったテキストどもどもの管理が行え雨量にした。
2.専門用語の自動認識プログラムの開発・学術情報センターにおいては、専門用語製を判定するための基本となる専門用語の統計的な性質を研究し、専門用語製判定のためのプログラム群を作成した。また、東京大学・辻井研究室ではn-gramの連結性を判定する速度を導入し、これがゲノム・サイエンス関連の文献から、その分野での専門用語を抽出するのに有効であることを確認した。これらのプログラム群は、中央データベースとそのインターフェース条件を満足するパッケージとして整理され、一つのシステムとして統合されている。
3.意味クラス同定のためのプログラム群の開発:東京大学・辻井研では、2で抽出された専門用語を、その周囲の環境に関する情報にしたがって意味的に分類する手法を開発した。これらは、ゲノム分野、株式分野、工業製品ニュースなどに適用され良好な結果を得ている。

報告書

(4件)
  • 1998 実績報告書   研究成果報告書概要
  • 1997 実績報告書
  • 1996 実績報告書
  • 研究成果

    (29件)

すべて その他

すべて 文献書誌 (29件)

  • [文献書誌] T.Koyama: "Research on Natural Low Database"Proc.JCKBSE'96. 242-245 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] K.Kageura: "Some Statistical Characterizations of Terminological and Non-Terminological Elements Evaluation and Examination in Tepanese Technical Abstiacts"TKE'96. 131-138 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] J.Tsujii: "Analysis of Word Structure of Medical Synonyms"TKE'96. 190-196 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] K.Kageura: "A Statistical Analysis of Morphemes in Japanese Terminorogy"COLING-ACL'98. 638-645 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] T.Makino,K.Torisawa,J.Tsujii: "LiLFeS-Practical Programming Language for Typed Feature Structures"Proc.NLPRS'97. 239-244 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] T.Seki*,H.S.Park,J.Tsujii: "Identifying the Interaction between Genes and Gene Products Based on Frequently Seen Verbs in Medline Abstracts"Genome Informatics. 9. 62-71 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Teruo Koyama: "Research on Natural Law Database"Proceedings of JCKBSE'96. 242-245 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Kyo Kageura: "Some Statistical Characterizations of Terminological and Non-Terminological Elements : Evaluation and Examination in Japanese Technical Abstracts"Proceedings of TKE'96. 131-138 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Junichi Tsujii: "Analysis of World Structure of Medical Synonyms"Proceedings of TKE'96. 190-196 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Kyo Kageura: "A Statistical Analysis of Morphemes In Japanese Terminology"Proceedings of COLING'98. 638-645 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Takaki Makino, Kentaro Torisawa, Junichi Tsujii: "LiLFeS-Practical Programming Language for Typed Feature Structures"Proceedings of NLPRS'97. 239-244 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Tsuyoshi Sekimizu, H. S. Park, Junichi Tsujii: "Identifying the Interaction between Genes and Gene Products Based on Frequently Seen Verbs In Medline Abstracts"Proceedings of Genome Informatics. Vol.9. 62-71 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Kageura,K.: "A Statistical Analysis of Morphemes in Japanese Terminology" COLING-ACL'98. 638-645 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] Kageura,K.: "Some Characteristics of Bibliometric Samples" Annals of Japan Society of Library Science. 443. 97-110 (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] T.Sekimizu,H.S.Park,J.Tsujii: "Identifying the Interaction between Genes and Gene Products Based on Fruquently Seen Verbs in Medline Abstracts" Genome Informatics. 9. 62-71 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] T.Hishiki,C.Nigel,C.Nobata,T.Ohta,N.Ogata,T.Sekimizu,R.Stener: "Developing NLP tools for Genome Informatics : An Information Extraction perspective" Genome Informatics.

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 中井、池原、白井: "「の型名詞句」に対する名詞句間の意味的係り受け規則の自動生成" 電子情報通信学会、NLC研究会、信学技報. NLC98-3. 15-22 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 緒方 典裕: "型理論に基づいた特定領域テキストからの動的なTaxonomy,Mereology構成" 情報処理学会研究報告. 98-NL-127. 133-140 (1998)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] J.Tsujii et al: "Towards a Sublanguage-Based Semantics Clustering Algorithm" Recent Adtnces in Natural Language Processing. 377-392 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 緒方典裕: "Dynamic Canstructive Thesaurus" 第5回国立国語研究所国際シンポジウム第1専門部会論文集. 182-189 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] ToMakino,K.Torisawa & J.Tsujii: "LiLFeS-Practical Progamiming Lauguage for Typed Feature Structures" Proc.NLPRS 97. 239-244 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 緒方典裕、高橋るり子: "形式談話理論 基づいたテキスト中の因果関係抽出に向けて" 人工知能学会言語音声理解と対話処理研究会. SIG SLUD 9703. 13-20 (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 辻井 潤一: "視点の変換-言語の理論から設計の理論へ" 人工知能学会誌. 11・4. 530-541 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 小山 照夫: "複数論文比較によるキーワード推定の試み" 情報知能学会第4回研究報告会講演論文集. 43-46 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] T.Koyama: "Research on Natural Law Database" Proc.JCKBSE'96. 242-245 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] K.Kageura: "Some Statistical Characterizations of Terminological and Non-Terminological Elements:Evaluation and Examination in Japanese Technical Abstracts" TKE'96. 131-138 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] K.Tsuji: "Analysis of Word Structure of Medical Synonyms" TKE'96. 190-196 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] K.Kageura: "Methods of Automatic Term Recognition-A Review" Terminology. 3・2(to appear).

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 影浦 峡: "文字単位のbigram尺度に基づく複合漢字列の単位切り手法" 言語処理学会第3回年次大会. (発表予定).

    • 関連する報告書
      1996 実績報告書

URL: 

公開日: 1996-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi