研究課題/領域番号 |
26330366
|
研究機関 | 岡山県立大学 |
研究代表者 |
磯崎 秀樹 岡山県立大学, 情報工学部, 教授 (00396144)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 質問応答システム / 論文 / 自然言語処理 |
研究実績の概要 |
本研究では、英語の論文を解析して、研究者の日本語の質問に答える「言語横断専門情報質問応答システム(論文QA)」を実現することを目的としている。このシステムは、専門分野を限定するつもりはないが、システムの出力が開発者自身にわかりにくいことを避けるため、開発者自身のよく知っている専門分野である自然言語処理分野を当面対象とする。この論文QAシステムは、研究者の良き相談相手となることを目指している。 英語や日本語などの「自然言語」を上手に解析する技術の中には、様々な応用に利用できる特に重要な課題がある。例えば、文章の中に含まれる固有名詞を検出して分類する「固有表現抽出」という課題がある。そして、この課題には、正解がわかっている「標準データ」が存在する。「固有表現抽出」の場合は、人間が正しい固有名詞の範囲を見つけて、それが人名か、地名か、組織名か、などと正しく分類した「正解データ」を作る。 そのような重要な課題を選定し、「標準データ」と「正解データ」を作っておくこことで、最先端のツールと自分の使っているツールがどの程度かけはなれているのか、あるいは、自分が新たに作成したツールがどの程度のレベルなのかを客観的に把握するためにこのシステムは大変重要となってくる。 本年度は、この「標準データ」を考慮して、論文中から最高精度を検出するモジュールなどを作成した。そのため、論文QAシステムの改良が進み、より多くの質問に正解することができるようになった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
個々の機能モジュールの実装に時間がかかりすぎ、全モジュールを統合してのテストがまだ十分行えていない。
|
今後の研究の推進方策 |
できるだけたくさんの質問を集めて、それらに正しく回答できるようにシステムに改良を加える。そして、全モジュールのテスト回数を増やし、正確な応答ができるよう目指していく。
|
次年度使用額が生じた理由 |
物品費については、深層学習の計算機は日々その性能が向上している為、次年度以降の購入が妥当と考え本年度の支出を控えた。旅費については、予定していた国内発表に発表資料が間に合わず、発表に至らなかったので、宿泊費等が不要になった。
|
次年度使用額の使用計画 |
深層学習用計算機の購入とそれを用いたシステム全体の統合テストを実施する。
|
備考 |
(1)は、著者自身のページ、(2)は、情報処理学会全国大会の該当論文のページ
|