2006 Fiscal Year Annual Research Report
意味ネットワークのグラフ計算による、潜在知の体系的抽出と言語情報システムの開発
Project/Area Number |
18500192
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
赤間 啓之 東京工業大学, 大学院社会理工学研究科, 助教授 (60242301)
|
Co-Investigator(Kenkyū-buntansha) |
仁科 喜久子 東京工業大学, 留学生センター, 教授 (40198479)
清水 由美子 武蔵工業大学, 環境情報学部, 助教授 (30298020)
三宅 真紀 大阪大学, 大学院言語文化研究科, 助手 (80448018)
|
Keywords | 意味ネットワーク / グラフ理論 / 潜在知 / 教育情報システム / 暗黙知 |
Research Abstract |
グラフ理論に新しい計算手法を導入し、1)文献資源のトピックスを対象としたオントロジーの半自動生成と2)日英の双方に関し、連想概念情報検索システム-連想作文支援システムの開発(教育・学習資源の構築)に同時に適用する試みを行った。特に(Markov Clustering)を改良したRMCL,BMCLという手法を提案、聖書や小説(『星の王子様』)、思想書(ソシュールの『一般言語学講義』)、連想辞書に適用し意味ネットワーク構築を行った。それらの結果をRMCLnet(グラフクラスタリング表示検索システム)、ACSS(連想作文等創造的発想支援システム)という、Web情報検索システムの形で公開した。また、国語辞典の意味ネットワーク形成にも応用すべく、形態素解析の後の人手によるチェック、特にひらがなに開かれた同音異義語の選定作業を行った。これらの成果は、国内外の学会(LREC2006,ICALT2006など)で発表されている。 RMCL(Recurrent Markov Clustering)は、収束段階で非連結になったMCLのクラスタ結果を再入力し、クラスタリングの計算段階で過去に記録された隣接関係を復元して、それをもとに潜在的な隣接関係を復元したうえで、MCLを反復しておこなう。BMCL(Branching MCI)とは、逆に極端にサイズの大きいマルコフクラスターを潜在隣接関係の導入によって再分割する手法である。これらにより、自動的にクラスタの概念名を決定しながら、概念カテゴリー間の相互関係を示す概念リンク情報(隣接行列)を(再)構築することが可能になる。
|
Research Products
(6 results)