• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

高度情報検索システムのための言語情報処理に関する研究

研究課題

研究課題/領域番号 62210012
研究種目

特定研究

配分区分補助金
研究機関九州大学

研究代表者

松尾 文碩  九州大学, 工学部, 助教授 (80037845)

研究分担者 高木 利久  九州大学, 工学部, 助手 (30110836)
松延 栄治  九州大学, 大型計算機センター, 助手 (30199830)
二村 祥一  九州大学, 大型計算機センター, 助手 (90038068)
研究期間 (年度) 1987
研究課題ステータス 完了 (1987年度)
配分額 *注記
1,700千円 (直接経費: 1,700千円)
1987年度: 1,700千円 (直接経費: 1,700千円)
キーワード情報検索システム / 自然言語理解システム / 英単語の用法
研究概要

本研究において知見を得たいことの一つは, 研究代表者らが開発した1,667単語の否定辞書をもとに, 約2,000語の英文科学技術文献用機能語を定め, それらの機能語の構文.意味情報によって, 抄録文がどの程度"理解"できるかということである. 1,667単語のうち, 動詞を品詞としてもつ単語が最も多いということは, これらの機能語による"理解"についてある程度の可能性を示唆するものである. しかし, 動詞に関しては, これらの機能語に含まれる動詞だけでは十分ではない. その原因の一は, 動詞makeの用法がある. 例えば, "make measurements"というとき, 大意は動詞measureである. 従って, この場合, 形式的にはmakeが動詞であっても, mesurementのような名詞が実質的に動詞の役割を果している. そこで, 本年度は科学技術抄録文におけるmakeの用法を調査した. ここでは, "make measurements"のような用法を行為化用法というと, 行為化用法はmakeの用法の約半分(53.6%)を占めることがわかった. また, 行為化用法の名詞数Dは, 行為化用法数Tの平方根に比例することが判明した. 単語の異なり数も単語の延べ数の平方根に比例することが知られているが, 行為化用法の名詞数の場合の比例定数は一般の単語の場合の1/3.5である. 更に, 行為化用法の低頻度名詞の相対生起頻度(生起確率)が低頻度単語と同様に, 生起順位の二乗に逆比例するとしたら, 比例係数は一般の単語の1/12であることを示すことができる. 以上のことから, 87万の調査文の範囲内では, 行為化用法の名詞数には上限は認められないが, 用法数の増加に伴う名詞の異なり数の増加は緩やかであり, かつ低頻度名詞を伴う用例は比較的少数であるので, 高頻度名詞だけでも, かなりの文章理解が可能であると判断できる. つまり, makeの行為化用法は比較的少数の機能語による"理解"を防げるものではないことが示された.

報告書

(1件)
  • 1987 実績報告書
  • 研究成果

    (2件)

すべて その他

すべて 文献書誌 (2件)

  • [文献書誌] 二村祥一,松尾文碩: 情報処理学会論文誌. 28. 737-747 (1987)

    • 関連する報告書
      1987 実績報告書
  • [文献書誌] 二村祥一,松延栄治,松尾文碩: 昭和62年度・電気関係学会九州支部連合大会講演論文集. (1987)

    • 関連する報告書
      1987 実績報告書

URL: 

公開日: 1987-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi