2007 Fiscal Year Annual Research Report
意味ネットワークのグラフ計算による、潜在知の体系的抽出と言語情報システムの開発
Project/Area Number |
18500192
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
赤間 啓之 Tokyo Institute of Technology, 大学院・社会理工学研究科, 准教授 (60242301)
|
Co-Investigator(Kenkyū-buntansha) |
仁科 喜久子 東京工業大学, 留学生センター, 教授 (40198479)
清水 由美子 武蔵工業大学, 環境情報学部, 准教授 (30298020)
三宅 真紀 大阪大学, 大学院・言語文化研究科, 助教 (80448018)
|
Keywords | 意味ネットワーク / グラフ理論 / 潜在知 / 教育情報システム / 暗黙知 |
Research Abstract |
グラフ理論に新しい計算手法を導入し、それらをもとにして、1)日英双方の辞書資源(学研国語大辞典,WordNet)の意味ネットワークを介したシソーラスの自動生成や、2)様々な文献資源、特にフランス語の思想書(カバニス、メスメル)、小説(サンティグチュペリ)のトピックスの潜在的な意味分析を行なった。特にグラフクラスタリングの技術であるMCL (Markov Clustering)の欠点として知られる、クラスター係数の低い場合の精度の悪さ(Modularity Qの値の低さ)を克服するため、いくつかの技術を提案した。すなわち、ハブ語のまわりにサイズの大きすぎるコアクラスターが生成したり、1クラスター1語というシングルトン・クラスターが生成したりする場合に、事後的にサイズ調整を行なうため、潜在隣接の概念を導入し、それをもとにした潜在隣接クラスタリングという方法を編み出した。 これらの成果は、国内外の学会(PACLIC21、 PACLING-2007、 ED-MEIDIA2007など)で発表されている。特にPACLIC21では、連想辞書の次数分布とグラフクラスタリングの特色を分析し、Best Paper Awardを受賞した。また意味ネットワークの技法に適用した聖書研究では研究分担者である三宅真紀がBursary Awardを受賞している。
|
Research Products
(10 results)