2008 Fiscal Year Annual Research Report
情報の遷移にダイナミックに追従するインターネット単語帳システムの開発
Project/Area Number |
20500833
|
Research Institution | Mie University |
Principal Investigator |
桝井 文人 Mie University, 大学院・工学研究科, 助教 (80324549)
|
Co-Investigator(Kenkyū-buntansha) |
木村 泰知 小樽商科大学, 商学部, 准教授 (50400073)
RAFAL Rzepka 北海道大学, 工学研究科, 助教 (80396316)
|
Keywords | description / descriptor / WWW / 心理学実験 / 人間判断 / 統語パターン / 適合フィードバック / descriptorの分類 |
Research Abstract |
研究実施計画に基づいて,一連の研究を実施した. (1)WWWにおけるdescriptorの調査:29個のクエリ(名詞)を用いてWWWからdescriptor集合を半自動で収集し,得られたデータを分析した.descriptorの尤度を5種類の統計量(頻度,頻度と局所性,独立性,正規性,相互情報量)で表現し,それぞれの分布と傾向,タイプや多義性との関連を調べた.その結果,統計量毎に機能の異なるdescriptionモデルが構築できることが示唆された.descriptor集合が一定の規模に達すれば主要な表現能力が確保できることがわかった.これにより,descriptor集合の全体的な表現能力,集合規模と表現能力の関係を統計学的に推定できる見通しを得た. (2)人間判断によるdescriptorの収集:被験者75名を用いて心理学実験を実施した.6個の刺激語に対し238のdescriptorを収集し,さらに6つタイプ(上位語・主体-特徴・本体-部分・組織-構成要素・比喩・連想)のいずれに適合するかを評価した.その結果,比喩や上位語について被験者間で高い一致性があり,刺激語の抽象度とdescriptor集合のばらつきや規模に関連することがわかった.収集データは評価用基礎データとして利用できる. (3)descriptorの分類機構と洗練モデルの検討構築:[a]4種類の統語パターンを利用してWWWから適合フィードバックを行い,descriptorを上位語,主体-特徴,連想に3分類する機構を設計した.シミュレーション実験によって,約80%(再現率75%,精度84%)の分類性能が見積もられ自動分類の見通しがついた.[b]相対表現を利用して動向に関する関連知識抽出機構を構築し,実験によって有効性を確認した.これによりdescriptor洗練手法の要素技術が得られた.
|
Research Products
(4 results)