研究課題/領域番号 |
15K12103
|
研究機関 | 関西大学 |
研究代表者 |
松下 光範 関西大学, 総合情報学部, 教授 (50396123)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | コミック工学 / 質問応答 / 探索的検索 |
研究実績の概要 |
本研究の目的は (1)コミックコンテンツのコード化手法の検討、(2)コミックコンテンツに対する対話的情報アクセス手法の実現、(3) 質問応答・要約アプリケーションの試作である。 (1) についてはまず、(a) 機械学習による内容情報の抽出と分類を行った。コミックコンテンツに対して内容情報を表すアノテーションを付与する際、文字情報のみではなく描かれているキャラクタやアイテムに対してもアノテーションを付与する必要がある。しかし現在、コミックの大半は画像ファイルでありその抽出が難しい。そこで、コミックから直接内容情報を抽出するのではなく、外部の情報獲得可能なリソースとしてコミックに言及したレビューに着目し、コミック1000作品を対象にそれらに言及したレビュー集合からTF-IDF法と階層型潜在ディリクレ分析法 (hLDA)を併用して、各コミックを特徴付けるトピックを自動で抽出・分類することを試みた。次に、(b) 「ドラえもん」(藤子・F・不二雄著)1-7 巻を対象として、それらに含まれる要素を抽出して階層的にアノテーションを付与したテストコーパスを人手で作成した。また、その作成を通じて得られた知見に基づきアノテーションセットの体系整備を行った。 (2) については、(1)の(a)で得られたトピックをもとにコミック間の内容的類似度を決定し、それに基づいて探索的にコミックにアクセスするインタフェースを実装した。このインタフェースを用いたユーザ観察を行い、システムの有効性を確認した。 (3) については、(1)の(b)で構築したテストコーパスを対象とし、その中に含まれる要素に着目して、(1)要素の出現位置、(2) シーン情報、(3)要素の詳細、に関する質問に回答可能な質問応答システムを試作した。試作したシステムはユーザから与えられた質問を自動でタイプ分類することで回答方略を決定し、それに応じて回答を生成する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今期の目標は、コミックコンテンツからユーザが知りたい情報をインタラクティブに取得できるようにする情報アクセス技術を実現することであり、その手段として、コミックを対象としたオントロジの策定と要素のアノテーション付与を行うこと、ならびにアノテーションの自動付与の方法を検討することであった。今年度の研究では、まず、コミックコーパスとして「ドラえもん」(藤子F不二雄著、小学館)を対象とし、そこに出現する要素のタグ付けを人手で行うことで、テストコーパスを作成した。このテストコーパスに基づき内容情報のオントロジを試作し、それに基づいて要素を分類・整理してコミック質問応答システムで利用可能にした。また、hLDA 法とtf-idf 法の併用によりレビューからコミックの内容情報を獲得し、その内容的特徴を表すキーワード集合として取得できるようにした。これらにより、各コミック作品に対して基本的なアノテーションの付与が可能になった。アノテーションの自動付与に関しては、コミックの内容レベルでの付与は自動的に行えるようになったが、要素に関してはまだ基礎検討にとどまっているため、積み残しとなっている。そのかわりに、次年度以降で予定していたプロトタイプシステムの試作を前倒しで進め、「ドラえもん」に出現する道具に関する質問応答が可能なコミックQAシステムを実現した。更に、コミック要素の1つである漫符に着目して、それを活用したインタラクティブな漫符絵本システムを試作した。これは研究策定段階では想定していなかった余剰の成果である。これらを総合的に判断すると、研究全体としては概ね順調に進捗していると結論付けられる。
|
今後の研究の推進方策 |
現在積み残しの課題としては、コミックの作品内にアノテーションを自動付与することであるが、そのために、コミック内に出現する固有表現(e.g., 「ドラえもん」「タケコプター」)、およびそのカテゴリ情報(e.g., 「ドラえもん」なら「キャラクター」、「タケコプター」なら「アイテム」)を事前に計算機が把握している必要がある。そこで、今年度は、レビューや wikipedia, あらすじ情報などを対象とした間接的なアプローチで、これらの固有表現とそのカテゴリ情報を事前に取得する方法でその実現を目指す。 また、今年度はアプリケーションの開発として、質問応答システムとコミック要素を用いたインタラクティブシステムのふたつの開発をすすめる。質問応答システムに関しては、現在のプロトタイプシステムをベースラインとして、精度の向上と取り扱える質問範囲の拡充を目指す。また、コミック要素を用いたインタラクティブシステムに関しては、漫符やオノマトペを活用したインタラクティブシステムの開発を進める。 また、成果の共有と公開を積極的に進めるために、対外発表やワークショップの開催を行う。
|
次年度使用額が生じた理由 |
H27年度は想定より多くの対外活動を行ったため、出張費費がかさんで予算が不足した。そのため、2015年11月に行ったマレーシアの国際会議ACE2015への出張費および参加費をH28年度の予算と併せて清算することとしたため、端数の金額が残る形となった。
|
次年度使用額の使用計画 |
本年度は引き続きテストコーパスの拡充と精査を図るため、作業の謝金および作業に必要な機器の補充(HDD, OCR)として25万円を予定する。また、今年度はこれまでの成果と当該研究に関わる分野の醸成に力をいれるため、国内で1回 (人工知能学会全国大会, 福岡県)、海外で1回 (ACIS2016, Thailand) のテーマセッションを企画する。この経費として国内分20万円、海外分50万円を予定する。また、これとは別に国際会議での発表1件(TAAI2016, 台湾)を予定しており、その会議参加費および旅費として15万円を予定する)残額を昨年度の精算に充てる。
|