2011 Fiscal Year Research-status Report
言語の非線形性に基づく自然な対話を実現するための発話モデルの構築
Project/Area Number |
23720222
|
Research Institution | Nagano National College of Technology |
Principal Investigator |
奥村 紀之 長野工業高等専門学校, 電子情報工学科, 助教 (40510277)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | 話題選定 / 概念ベース / 関連度計算 / シソーラス |
Research Abstract |
本年度は,主として話題連想に関する検討を行ってきた.人と人の会話をコンピュータ上でエミュレートするための素材としてTwitterのログを利用し,テキストマイニングソフトを利用して語間の相関度を求め,話題候補語群を収集するシステムを開発した.さらに,概念ベースによる語の選別,Wikipediaと日本語語彙体系を複合した階層構造による話題選別を行うことで,よりユーザにとってふさわしいと考えられる話題を選定できるようになり,本件については言語処理学会第18回年次大会において研究成果報告を行っている.また,特に時間に関する情報に特化した話題抽出,選定の試みとして,物語文章からの時系列情報を抽出することにより,時間の流れに即した話題を選定するためのシステムを開発している.これに関しては,国際会議KEOD2012に投稿済みである. また,Twitterから抽出した話題候補語群を概念ベースを用いて選別する場合,概念ベースに含まれている語彙(約12万語)では対応できないような語も多く含まれており,概念ベースの自動拡張に関する課題が生まれた.そのため,Googleの検索結果を利用して,動的に概念ベースを拡張させるためのシステムを開発し,その性能評価を行った.本件に関しては,国際会議KEOD2011の特別セッション,並びに言語理解とコミュニケーション研究会で成果報告済みである.以上のことから,本年度の研究により,概念ベースの性能向上が話題選定において特に重要な役割を果たすことが判明した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,人間とコンピュータが自然に対話するための手法を構築するための足かがりとして,話題選定に着目し,語と語の関連を記述した概念ベースの有用性を検証することを目的としている.概念ベースや既存のシソーラスでは線形性に支配された語の連想しかできていないが,概念ベースの動的学習手法を検討することにより,連想範囲を拡大し,適切な語群を取得できるようになってきている.しかしながら,Web検索を利用した語の学習手法を用いる場合,通信速度等のボトルネックを解消する必要があるため,学習の並列化を並行して進めている.このことから,当初の研究計画に基づき,研究目的に即しておおむね順調に研究が進んでいると考えている.
|
Strategy for Future Research Activity |
特に概念ベースを利用した話題選定方法に関する研究を進める予定である.しかし,概念ベースそのものが動的学習に耐えうる構造となっていないという問題があるため,概念ベースの再構築を行うことにより,より柔軟な学習に対応できるよう,また,並列化して学習させられる構造へ拡張していくことを予定している.なお,対話相手のログを適切な形式で保管し,参照できるようにする必要があるため,ログの保存方法に関しても同時に検討していく.
|
Expenditure Plans for the Next FY Research Funding |
次年度が本課題の最終年度であるため,研究費は主に学会での成果報告のため使用する.すでに投稿中の国際会議への出席も含め,主として旅費に使用する予定である.なお、国際会議の出席費用を10万円と見込んでいたが、83000円程度で済んだため、18000円ほどの残額が生じている。これについては、次年度参考図書やバックアップ用メディアの購入に充当する予定である。
|
Research Products
(10 results)