• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大量学術情報データベースを対象とした語いの分析

研究課題

研究課題/領域番号 62210003
研究種目

特定研究

配分区分補助金
研究機関筑波大学

研究代表者

中山 和彦  筑波大学, 電子情報工学系, 教授 (50091913)

研究分担者 山本 順人  筑波大学, 電子情報工学系, 助手 (30111090)
坂口 瑛  筑波大学, 電子情報工学系, 助教授 (90026021)
研究期間 (年度) 1986 – 1988
研究課題ステータス 完了 (1987年度)
配分額 *注記
1,500千円 (直接経費: 1,500千円)
1987年度: 1,500千円 (直接経費: 1,500千円)
キーワードデータベース / 語い分析 / 出現頻度 / 学術情報 / 類似度
研究概要

本研究は筑波大学学術情報処理センサーにおける学術文献のデータ・ベースである「UTOPIA」を対象に, 文献情報を構成している語い(キーワード)の統計的性質,およびキーワードの抽出法を実証的に明確化させ, その結果をもとに, 文献データ・ベース構築の高度化を図ることを目的としたものである. 調査対象データ・ベースは, 広範囲の分野をおおうデータを持つものを13種選び, これに日常語の調査データをリファレンスとして用い, 以下のような研究を行い, いくつかの成果を得ることができた.
(1)語いの包含関係. データ・ベース中に出現する語いの種類とそれをふくむデータ・ベース数の関係から, 語いが特定の分野でのみ多様される, いわゆる専門用語で記述されているか, または, より普遍的な用語が用いられているかを調査した. その結果, 14種データ・ベース中12種に含まれる語いがもっとも少なく, 約2600語であること, 使用されている日常語は, 約8000語であることがわかった.
(2)語い集合の類似度. 語い空間から各データ・ベースの特徴を見出すことを試みた. すなわち, 各語いのデータ・ベース中に出現する度数から定義される正規化出現度数を用いてデータ・ベース間の類似度を, 3種類の方法で定義し, 対象データ・ベースに対し求めた.
(3)因子分析法を用いた解析. 類似度をもとに, 各データ・ベースが覆っている学術分野の傾向をもとめる因子分析を行った. その結果, データ・ベースを特徴付ける因子として, 「生体に関する因子」, 「社会活動に関する因子」, 「技術に関する因子」を抽出することができた.
(4)クラスター分析を用いた解析. 各類似度データに, クラスター分析を行い, データ・ベースのグループ化を試み, (3)の結果と比較した.

報告書

(1件)
  • 1987 実績報告書

URL: 

公開日: 1987-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi