2018 Fiscal Year Annual Research Report
Project/Area Number |
17J04768
|
Research Institution | The University of Tokyo |
Principal Investigator |
伊藤 友貴 東京大学, 工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2017-04-26 – 2020-03-31
|
Keywords | ニューラルネットワーク / テキストマイニング / サポートシステム |
Outline of Annual Research Achievements |
今年度は文書のポジネガ分類予測のタスクにおいて予測までの過程を単語センチメント・その極性反転・文書全体のうちどこが重要かをそれぞれ出力することで説明可能な、解釈可能なニューラルネットワークモデル CSNN の構築を文書とそのポジネガタグ・及び小規模な単語極性辞書 (約 100 単語)のみで構築する技術の提案に成功した。さらに、実データを用いた検証により、本手法が日本語のみならず英語にも適用可能であり、さらに経済文書のみならず Amazon Product Review などの商品レビューや Twitter についても適用可能であるという汎用的な手法であることを実証した。本研究成果については現在国際会議に投稿中である。 さらに、共同研究先である web 企業と共に CSNN あるいは CSNN 構築において利用する要素技術を用いての新しいサービス作りへの取り組みも開始し、本研究の社会実装に向けてもスタートを切ることができた。 以上のように、本年度は本研究プロジェクト達成のために核となる技術の創出を行うと共に、研究成果の社会実装に向けて動き出すことに成功した。次年度は社会実装に向けてより現実的な問題設定・タスク設定での解釈可能なニューラルネットワークモデルの構築手法の考案・及び本プロジェクトで提案した手法による新たなサービス・プロダクト創出に向けての研究開発をメインに進めることになってくると思われるが、その足掛かりをしっかりと創ることができた。 また、本プロジェクトの研究成果について、今年度は 査読あり国際会議 3 本及び査読あり国際論文誌 1 本 に採択させることに成功し、業績としても一定の成果を出すことができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度は文書のポジネガ分類予測のタスクにおいて予測までの過程を単語センチメント・その極性反転・文書全体のうちどこが重要かをそれぞれ出力することで説明可能な、解釈可能なニューラルネットワークモデル CSNN の構築を文書とそのポジネガタグ・及び小規模な単語極性辞書 (約 100 単語)のみで構築する技術の提案に成功した。さらに、実データを用いた検証により、本手法が日本語のみならず英語にも適用可能であり、さらに経済文書のみならず Amazon Product Review などの商品レビューや Twitter についても適用可能であるという汎用的な手法であることを実証した。本研究成果については現在国際会議に投稿中である。 さらに、共同研究先と共に CSNN を用いての新しいサービス作りへの取り組みも開始し、本研究の社会実装に向けてもスタートを切ることができた。 以上のように、本年度は本研究プロジェクト達成のために核となる技術の創出を行うと共に、研究成果の社会実装に向けて動き出すことに成功した。次年度は社会実装に向けてより現実的な問題設定・タスク設定での解釈可能なニューラルネットワークモデルの構築手法の考案・及び本プロジェクトで提案した手法による新たなサービス・プロダクト創出に向けての研究開発をメインに進めることになってくると思われるが、その足掛かりをしっかりと創ることができた。 また、本プロジェクトの研究成果について、今年度は 査読あり国際会議 3 本及び査読あり国際論文誌 1 本に採択させることに成功し、業績としても一定の成果を出すことができた。さらに、PAKDD 2018 Student Travel Award も獲得することができ、対外的にもインパクトのある研究成果を出せた。
|
Strategy for Future Research Activity |
今後は現在提案している CSNN モデルをさらに実タスクで使いやすいように改良する予定である。 特に少数のラベルつきデータしかない場合でも CSNN を構築できるような手法の提案を主に行う予定である。具体的にはラベルなしデータの有効活用の手法の模索、他のドメインのデータを利用し、少数のデータしかないようなドメインの文書に対しても CSNN を構築できるような手法の提案などが挙げられる。 また、上記とは別に本研究の実サービスへの応用 (= 社会実装) も考えており、そちらについても共同研究先と共に進める予定である。社会実装にあたっては実サービスにおいてどのような情報の抽出が必要かを定義すると共に、個々に応じた CSNN のカスタマイズが必要になってくる。そのため、本課題においてはどのようにカスタマイズするのかが焦点になる。
|
Research Products
(5 results)