研究課題/領域番号 |
19H01118
|
研究機関 | 東京工業大学 |
研究代表者 |
岡崎 直観 東京工業大学, 情報理工学院, 教授 (50601118)
|
研究分担者 |
荒牧 英治 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (70401073)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | 自然言語処理 / 意味解析 / 議論マイニング / SNS分析 / 知識獲得 |
研究実績の概要 |
本研究は,コンピュータが常識的な知識を自動的に獲得し,その知識を活用することで、異なる箇所で言及される情報を記憶・蓄積し,不足している情報を補いながら文章を推論・解釈するアーキテクチャを実現することを目指すものである. 常識的な知識を自動的に獲得するため,単語の分散表現から上位・下位などの階層関係を反映した階層性のあるコード表現に変換する研究を進めた.語彙資源から得られる上位下位語ペアを教師信号とすることにより,単語間の上位下位関係を考慮しつつ離散コードへ変換する統計モデルを確立した.上位下位関係の分類タスクにおいて先行研究と比較したところ,既存手法を上回る性能を達成した.本研究は言語処理学会第27回年次大会で発表したところ,優秀賞を受賞した. SNS上のテキストの意味解析技術の確立に向けて,本研究では特に画像に注目している.そこで,これに対応した形態素解析.構文解析,固有表現抽出などの言語解析器を開発している.今年度は,アノテーション枠組みを考案し,約3,000発言からなるコーパスを構築した. 自動獲得した常識的知識に基づいて推論するアーキテクチャ,および議論マイニングによる実社会の課題の解決に向けて,国立情報学研究所が主催している評価型ワークショップNTCIR15 QA Lab-PoliInfo2のStance Classificationタスクに参加した.このタスクでは,会議録を情報源として発言者の各議案に対する賛成・反対の立場を推定するタスクに取り組んだ.本研究で開発した手法は参加システム中1位の成績を収めたほか,第15回NTCIRプレゼンテーション賞を受賞した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
議論マイニングに必要な常識的知識の獲得では,上位・下位などの階層関係を反映した階層性のあるコード表現の研究を進め,年次大会の優秀賞を受賞した.また,SNS上のテキストの意味解析技術の確立では,約3,000発言からなるコーパスを構築した.自動獲得した常識的知識に基づいて推論するアーキテクチャの確立,および議論マイニングによる実社会の課題の解決では,評価型ワークショップに参加しながら研究を進め,参加システム中1位の成績となるなど,本研究の優位性を示すことができた. ところで,2020年1月頃から流行が始まった新型コロナウィルス(COVID-19)は,人々の活動に大きな影響を与えた.新型コロナウィルスへの対応や,オリンピックの開催・延期など,研究者や政治家のみならず,全国民の関心を持つ議論トピックが出現した.新型コロナウィルスの感染拡大は進行中の事象であり,変異種やワクチン接種の開始など,これまでの「常識」が覆ることがある.そこで,2020年度に新型コロナウィルスに関する知識を付与したコーパスの設計および構築を進めるなど,新たな社会問題に合わせながら研究を遂行している. 以上のことから,コーパスの構築および言語解析器の開発,自然言語解析のための基盤研究,実社会の課題の解決に向けた研究は順調に進展している。
|
今後の研究の推進方策 |
議論マイニングに必要な常識的知識の獲得では,昨年度までの研究成果の分析を進め,研究論文にまとめる.また,引き続きコーパスの構築や解析技術の研究・開発を進めながら,新型コロナウィルスに関する知識を自動的に獲得する方策を検討する. SNS上のテキストの意味解析技術の確立では,昨年度開発したコーパスを用いて,画像とテキストの関係に対応した解析器のプロトタイプを構築する.解析器の出力は画像に関する情報をも含んでおり,高次の処理によるパフォーマンスとの関連も調査する. 自動獲得した常識的知識に基づいて推論するアーキテクチャ,および議論マイニングによる実社会の課題の解決では,昨年度に開発した新型コロナウィルスに関するコーパスを拡充しつつ,新たな解析手法の確立を目指す.新型コロナウィルスのような進行中の事象では,正しいと考えるものが専門家によって異なることがある.そこで,事前に自動獲得した常識的知識だけでなく,様々な専門家によって発信された文書も背景知識として活用することで,方策や行動の賛否およびその根拠を幅広く抽出する手法を探求する.
|