2009 Fiscal Year Annual Research Report
グラフクラスタリングに基づいた日本語作文支援システムの開発と評価
Project/Area Number |
07J02878
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
鄭 在玲 Tokyo Institute of Technology, 大学院・社会理工学研究科, 特別研究員(DC1)
|
Keywords | 意味ネットワーク / グラフクラスタリング / 単語連想データ / 言語学習支援システム |
Research Abstract |
本研究は、単語連想データをもとに意味ネットワークを構築することで、言語の潜在的関係・構造を可視化する方法を開発し、それから得られる言語的・文化的分析の結果を言語教育や学習用のシステムの開発に活用できるようにすることを目指している。この研究目的に従い、平成21年度に主に行われた研究内容は次の2つである。(1)日本語、英語、韓国語の連想データの総合的分析及びクラスタリング方法の改良による単語学習用システムのデータベース構築及び補完。(2)単語連想データをもとに意味ネットワークを構築・分析・応用する課題で平成19年から今まで3年間行ってきた研究内容を博士論文にまとめ。 単語連想データを意味ネットワークに表現し、グラフ理論とネットワークツールによって分析することは言語的、文化的、認知的な面から総合的に言語データの分析することを可能にする。こうしたことから、日本語、英語、韓国語の三つの言語の意味ネットワークを構築し、今まで提案してきた様々なクラスタリングのアルゴリズムやグラフ理論の概念を用い、統合的にデータを分析、比較した。その結果は、査読付きの国際学会(ICALT2009)と国内学会(文理シナジー学会)で発表し、言語データのネットワークツールにによる分析方法が意味情報の抽出のみならず、言語に表れる認知的、文化的な面の情報も共に効果的に見出すのを可能にすることについて、様々な背景をもつ研究者たちから関心を集めた。また、三つの言語の意味ネットワークは連想情報の抽出や単語学習用コンテンツに使わられるように、既存に提案したシステムのデータベースとして入れ、システムの内容を補完し、多様に活用できるようにした。平成21年度の研究内容を含んで今までの研究成果を博士論文(論題:"Structures and Senses in Semantic Networks Built from Word Association Data")にまとめて、平成22年3月26日博士学位を取得し、無事に博士課程を修了した。しかも、総合的に博士論文でまとめられた研究成果をもとに、computational neurolinguisticsの研究への活用を提案し、査読付きの国際学会(NAACL HLT2010)を通した(2010年6月発表予定)。これは、3年間の研究成果の有用性と発展の可能性を見せることであると思われる。
|
Research Products
(4 results)