研究課題/領域番号 |
19500135
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 国立情報学研究所 |
研究代表者 |
小山 照夫 国立情報学研究所, 情報社会相関研究系, 教授 (80124410)
|
研究分担者 |
竹内 孔一 岡山大学, 大学院・自然科学研究科, 講師 (80311174)
|
研究期間 (年度) |
2007 – 2009
|
研究課題ステータス |
完了 (2009年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2009年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2008年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2007年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 用語抽出 / 用語体系化 / 自然言語処理 / 形態素解析 / 部分研究領域 / 複合語構造解析 / 部分研究領域同定 / 用語分類 / 語彙概念構造 |
研究概要 |
本研究ではまず、専門分野テキストコーパスに出現する複合語用語を、高い精度で網羅的に抽出する手法を確立した。日本語名詞形態素の内で、複合語構成上制約のあるものを整理し、また、形態素解析誤りの影響を受けやすい部分からの候補抽出を避けることによって、一定の抽出精度を保ちながら、コーパス内出現頻度の低いものまで網羅的に用語を抽出することが可能となる。本研究ではまた、複合語の入れ子関係を用いた用語の階層的構造化と、部分研究領域に強く関連する形態素を選択し、これらの形態素を要素として含む複合語を選択することにより、部分研究領域に関連づけた用語体系化が可能となる事を明らかとした。
|