常識的知識を活用した言語理解・推論に基づく議論マイニングの新展開

研究課題

研究課題/領域番号	19H01118
研究種目	基盤研究(A)
配分区分	補助金
応募区分	一般
審査区分	中区分61:人間情報学およびその関連分野
研究機関	東京工業大学
研究代表者	岡崎直観東京工業大学, 情報理工学院, 教授 (50601118)
研究分担者	荒牧英治奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (70401073)
研究期間 (年度)	2019-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	44,980千円 (直接経費: 34,600千円、間接経費: 10,380千円) 2023年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円) 2022年度: 8,580千円 (直接経費: 6,600千円、間接経費: 1,980千円) 2021年度: 10,400千円 (直接経費: 8,000千円、間接経費: 2,400千円) 2020年度: 11,310千円 (直接経費: 8,700千円、間接経費: 2,610千円) 2019年度: 8,450千円 (直接経費: 6,500千円、間接経費: 1,950千円)
キーワード	自然言語処理 / 知能情報処理 / 深層学習 / 大規模言語モデル / 知識獲得 / 意味解析 / 議論マイニング / SNS分析
研究開始時の研究の概要	SNSから収集した人々の発言や意見を分析し、その議論構造を明らかにする研究に取り組み、議論マイニング研究の新展開を目指す。この目標に向けて、SNSテキストの高度な言語解析、常識的な知識の自動獲得、知識を活用した言語の理解・推論といった基盤研究を進める。これらの基盤研究は、コンピュータが常識的な知識を獲得・活用しながら言語の理解・推論を行うという人工知能の長年の課題への突破口につながる。さまざまな人間の価値観が混在している状況下での合意形成・世論形成のメカニズムの解明や、国民総動員の健全な議論の支援を見据え、ウェブ上の意見を集約・構造化を行うシステムを構築する。
研究成果の概要	言語モデルの大規模化という自然言語処理研究の潮流を意識しつつ、研究を進めた。静的な分散表現から単語の知識を獲得する研究、動的な分散表現を既存のオントロジーに適応させる研究、SNS上のテキストの意味解析技術に関する研究、生成型言語モデルによるアスペクトベース意見分析、言語モデルの推論の確信度に関する研究、言語モデルが特定のテキストの知識を事前に学習したかを判別する研究、会議録から発言者の各議案に対する賛否を推定する研究、暗黙の意見表明に対してアスペクトベース意見分析で解析結果の説明を行う研究を通して、常識的な知識を活用しながら言語理解・推論、および議論マイニングを行う手法を深化させた。
研究成果の学術的意義や社会的意義	言語処理学会年次大会の優秀賞を２件、委員特別賞を１件、若手奨励賞を１件通算で受賞したほか、トップ国際会議であるACLでの発表1件を含め、査読付き国際会議に論文が複数採択されており、本研究成果は国内外で高く評価されている。常識的知識の活用により議論が理解できるようになることは、異なる箇所で言及される情報を記憶・蓄積し、不足している情報を補いながら文章を推論・解釈する文脈処理を実現することであり、その学術的貢献も大きい。大規模言語モデルが流行した現在においても、知識の活用は残された課題の一つとなっており、本研究成果の今後の展開が期待されている。

報告書

(7件)

研究成果
(44件)

すべて 2024 2023 2022 2021 2020 2019

すべて雑誌論文 (7件) (うち査読あり 7件、オープンアクセス 4件) 学会発表 (36件) (うち国際学会 9件、招待講演 13件) 図書 (1件)

[雑誌論文] ExtraPhrase: 生成型要約のための効率的データ拡張2023
- 著者名/発表者名
  Mengsay Loem, 高瀬翔, 金子正弘, 岡崎直観
- 雑誌名
  
  自然言語処理
  
  巻: 30 号: 2 ページ: 489-506
- DOI
  10.5715/jnlp.30.489
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] マルチモーダル文書におけるテキストと画像の整合タスクの提案2022
- 著者名/発表者名
  Muraoka Masayasu, Okazaki Naoaki, Kohita Ryosuke, Ishii Etsuko
- 雑誌名
  
  自然言語処理
  
  巻: 29 号: 4 ページ: 1198-1232
- DOI
  10.5715/jnlp.29.1198
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Why Videos Do Not Guide Translations in Video-guided Machine Translation? An Empirical Evaluation of Video-guided Machine Translation Dataset2022
- 著者名/発表者名
  Yang Zhishen, Hirasawa Tosho, Komachi Mamoru, Okazaki Naoaki
- 雑誌名
  
  Journal of Information Processing
  
  巻: 30 号: 0 ページ: 388-396
- DOI
  10.2197/ipsjjip.30.388
- ISSN
  1882-6652
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] A Preliminary Analysis of Offensive Language Detection Transferability from Social Media to Video Live Streaming Platforms2021
- 著者名/発表者名
  Zhiwei Gao, Shuntaro Yada, Shoko Wakamiya, Eiji Aramaki
- 雑誌名
  
  Advances in Intelligent Systems and Computing book series (AISC)
  
  巻: 1357 ページ: 121-132
- DOI
  10.1007/978-3-030-73113-7_11
- ISBN
  9783030731120, 9783030731137
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] 階層コード表現学習による上位下位関係の識別2021
- 著者名/発表者名
  水木栄, 岡崎直観
- 雑誌名
  
  情報処理学会論文誌データベース (TOD)
  
  巻: 14(4) ページ: 8-23
- NAID
  170000185676
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Making Twitter Safer: Uncovering Social-Bot on Twitter through User’s Content Approach2020
- 著者名/発表者名
  Nigo Sumaila, Shoko Wakamiya, Eiji Aramaki
- 雑誌名
  
  DBSJ Journal
  
  巻: 18 ページ: 1-7
- 関連する報告書
  2019 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Stance Detection Attending External Knowledge from Wikipedia2019
- 著者名/発表者名
  Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, Kentaro Inui
- 雑誌名
  
  Journal of Information Processing
  
  巻: 27 号: 0 ページ: 499-506
- DOI
  10.2197/ipsjjip.27.499
- NAID
  130007690194
- ISSN
  1882-6652
- 関連する報告書
  2019 実績報告書
- 査読あり / オープンアクセス
[学会発表] 大規模言語モデルにおける評価バイアスの尤度に基づく緩和2024
- 著者名/発表者名
  大井聖也, 金子正弘, 小池隆斗, Mengsay Loem, 岡崎直観
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] 大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃2024
- 著者名/発表者名
  綿祐貴, 金子正弘, Youmi Ma, 岡崎直観
- 学会等名
  言語処理学会第30回年次大会
- 関連する報告書
  2023 実績報告書
[学会発表] 自然言語処理の基礎2024
- 著者名/発表者名
  岡崎直観
- 学会等名
  言語処理学会第30回年次大会 (NLP2024) チュートリアルT1
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] Semantic Specialization for Knowledge-based Word Sense Disambiguation2023
- 著者名/発表者名
  Sakae Mizuki and Naoaki Okazaki
- 学会等名
  Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: EACL 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Selective-LAMA: Selective Prediction for Confidence-Aware Evaluation of Language Models2023
- 著者名/発表者名
  Hiyori Yoshikawa and Naoaki Okazaki
- 学会等名
  Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: EACL 2023
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Comparative evaluation of boundary-relaxed annotation for Entity Linking performance2023
- 著者名/発表者名
  Gabriel Herman Bernardim Andrade, Shuntaro Yada and Eiji Aramaki
- 学会等名
  Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Generative Data Augmentation for Aspect Sentiment Quad Prediction2023
- 著者名/発表者名
  An Wang, Junfeng Jiang, Youmi Ma, Ao Liu, and Naoaki Okazaki
- 学会等名
  Proceedings of the 12th Joint Conference on Lexical and Computational Semantics (*SEM)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 生成AIによる新しい医療言語処理: 創薬から臨床まで2023
- 著者名/発表者名
  荒牧英治
- 学会等名
  CHUGAI INNOVATION DAY 2023
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] 大規模言語モデル～言語モデルと自然言語処理のフロンティア2023
- 著者名/発表者名
  岡崎直観
- 学会等名
  2023年度統計関連学会連合大会
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] 次世代AIの舵取り：進化するAI技術と未来への展望2023
- 著者名/発表者名
  岡崎直観, 辻井潤一, 松原仁, 樋口知之
- 学会等名
  データサイエンス協会10thシンポジウム～データサイエンスの最前線～
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] 大規模言語モデルと科学研究2023
- 著者名/発表者名
  岡崎直観
- 学会等名
  第46回日本分子生物学会年会研究倫理委員会企画・研究倫理フォーラム
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] 埋め込み表現の意味適応による知識ベース語義曖昧性解消2023
- 著者名/発表者名
  水木栄, 岡崎直観
- 学会等名
  言語処理学会第29回年次大会 (NLP2023)
- 関連する報告書
  2022 実績報告書
[学会発表] ツイート発言の座標またはグリッドの予測基盤の開発2023
- 著者名/発表者名
  大西駿太朗，矢田竣太郎，若宮翔子，荒牧英治
- 学会等名
  言語処理学会第29回年次大会 (NLP2023)
- 関連する報告書
  2022 実績報告書
[学会発表] 誰に向けた発言か？：ツイートの指向性推定2023
- 著者名/発表者名
  清基英則，劉康明，矢田竣太郎，若宮翔子，荒牧英治
- 学会等名
  言語処理学会第29回年次大会 (NLP2023)
- 関連する報告書
  2022 実績報告書
[学会発表] 権利侵害と不快さの間：日本語人権侵害表現データセット2023
- 著者名/発表者名
  久田祥平，若宮翔子，荒牧英治
- 学会等名
  言語処理学会第29回年次大会 (NLP2023)
- 関連する報告書
  2022 実績報告書
[学会発表] オンライン議論の過熱と感情的投稿に関するダイナミクス2023
- 著者名/発表者名
  小林将大，矢田竣太郎，若宮翔子，荒牧英治
- 学会等名
  第15回データ工学と情報マネジメントに関するフォーラム (DEIM2023)
- 関連する報告書
  2022 実績報告書
[学会発表] ExtraPhrase: Efficient Data Augmentation for Abstractive Summarization2022
- 著者名/発表者名
  Mengsay Loem, Sho Takase, Masahiro Kaneko, and Naoaki Okazaki
- 学会等名
  Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop (NAACL SRW)
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Towards controllable, faithful, and explainable text generation2022
- 著者名/発表者名
  Naoaki Okazaki
- 学会等名
  Advances in Data Science and AI Conference 2022 (ADSAI 2022)
- 関連する報告書
  2022 実績報告書
- 国際学会 / 招待講演
[学会発表] 近傍の事例を活用したニューラル言語生成2022
- 著者名/発表者名
  岡崎直観
- 学会等名
  NAIST DSC NLP Seminar 2022 Summer
- 関連する報告書
  2022 実績報告書
- 招待講演
[学会発表] 抽出型要約と言い換えによる生成型要約の訓練データ拡張2022
- 著者名/発表者名
  Loem Mengsay, 高瀬翔, 金子正弘, 岡崎直観
- 学会等名
  言語処理学会第28回年次大会 (NLP2022)
- 関連する報告書
  2021 実績報告書
[学会発表] 確信度を考慮した言語モデルの関係知識評価2022
- 著者名/発表者名
  吉川和, 岡崎直観
- 学会等名
  言語処理学会第28回年次大会 (NLP2022)
- 関連する報告書
  2021 実績報告書
[学会発表] 疑似訓練データによる格助詞の省略に頑健な係り受け解析2022
- 著者名/発表者名
  石川遼伍, 丹羽彩奈, 水木栄, 岡崎直観
- 学会等名
  言語処理学会第28回年次大会 (NLP2022)
- 関連する報告書
  2021 実績報告書
[学会発表] 自然言語生成の現状と展望2021
- 著者名/発表者名
  岡崎直観
- 学会等名
  第41回医療情報学連合大会（第22回日本医療情報学会学術大会）
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] 自然言語処理の医療活用最前線2021
- 著者名/発表者名
  荒牧英治
- 学会等名
  日本薬剤疫学会総会
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] コロナとインフォデミック：ソーシャル・メディアが豊かにする社会とその危険性2021
- 著者名/発表者名
  荒牧英治
- 学会等名
  日本外来小児科学会年次集会
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] ソーシャルメディア：ニューノーマルがもたらした新しいRWD2021
- 著者名/発表者名
  荒牧英治
- 学会等名
  DIA CDMワークショップ
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] 階層コード表現を用いた上位下位関係の識別2021
- 著者名/発表者名
  水木栄, 岡崎直観
- 学会等名
  言語処理学会第27回年次大会 (NLP2021)
- 関連する報告書
  2020 実績報告書
[学会発表] 属性情報を追加した事前学習済みモデルのファインチューニング2021
- 著者名/発表者名
  笹沢裕一, 岡崎直観
- 学会等名
  言語処理学会第27回年次大会 (NLP2021)
- 関連する報告書
  2020 実績報告書
[学会発表] 長期Twitterユーザの投稿内容の経時的分析2021
- 著者名/発表者名
  廣田一輝, 村山太一, 矢田竣太郎, Kongmeng Liew, 若宮翔子, 荒牧英治
- 学会等名
  第13回データ工学と情報マネジメントに関するフォーラム (DEIM2021)
- 関連する報告書
  2020 実績報告書
[学会発表] ソーシャルメディア：ニューノーマルがもたらした新しいRWD2021
- 著者名/発表者名
  荒牧英治
- 学会等名
  第24回DIAクリニカルデータマネジメント・ワークショップ
- 関連する報告書
  2020 実績報告書
[学会発表] WER99 at the NTCIR-15 QA Lab-PoliInfo-2 Classification Task2020
- 著者名/発表者名
  Yuichi Sasazawa, Naoaki Okazaki
- 学会等名
  Proceedings of the 15th NTCIR Conference on Evaluation of Information Access Technologies
- 関連する報告書
  2020 実績報告書
[学会発表] Analyzing the Variation Property of Contextualized Word Representations2019
- 著者名/発表者名
  Sakae Mizuki, Naoaki Okazaki
- 学会等名
  AI 2019: Advances in Artificial Intelligence
- 関連する報告書
  2019 実績報告書
- 国際学会
[学会発表] Neural Question Generation using Interrogative Phrases2019
- 著者名/発表者名
  Yuichi Sasazawa, Sho Takase, Naoaki Okazaki
- 学会等名
  Proceedings of the 12th International Conference on Natural Language Generation
- 関連する報告書
  2019 実績報告書
- 国際学会
[学会発表] Learning to Select, Track, and Generate for Data-to-Text2019
- 著者名/発表者名
  Hayate Iso, Yui Uehara, Tatsuya Ishigaki, Hiroshi Noji,_Eiji Aramaki, Ichiro Kobayashi, Yusuke Miyao, Naoaki Okazaki, Hiroya Takamura
- 学会等名
  Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL)
- 関連する報告書
  2019 実績報告書
- 国際学会
[学会発表] 医療言語処理～これからのPatient Centricityを支援するテクノロジー～2019
- 著者名/発表者名
  荒牧英治
- 学会等名
  ITヘルスケア学会
- 関連する報告書
  2019 実績報告書
- 招待講演
[学会発表] モバイルヘルスケアを支える言語処理技術2019
- 著者名/発表者名
  荒牧英治
- 学会等名
  情報計算化学生物学会（CBI)
- 関連する報告書
  2019 実績報告書
- 招待講演
[図書] IT Text 自然言語処理の基礎2022
- 著者名/発表者名
  岡﨑直観、荒瀬由紀、鈴木潤、鶴岡慶雅、宮尾祐介
- 総ページ数
  320
- 出版者
  オーム社
- ISBN
  9784274229008
- 関連する報告書
  2022 実績報告書

常識的知識を活用した言語理解・推論に基づく議論マイニングの新展開

研究代表者

岡崎 直観 東京工業大学, 情報理工学院, 教授 (50601118)

44,980千円 (直接経費: 34,600千円、間接経費: 10,380千円)

報告書

研究成果

[雑誌論文] ExtraPhrase: 生成型要約のための効率的データ拡張2023

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] マルチモーダル文書におけるテキストと画像の整合タスクの提案2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] Why Videos Do Not Guide Translations in Video-guided Machine Translation? An Empirical Evaluation of Video-guided Machine Translation Dataset2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] A Preliminary Analysis of Offensive Language Detection Transferability from Social Media to Video Live Streaming Platforms2021

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] 階層コード表現学習による上位下位関係の識別2021

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] Making Twitter Safer: Uncovering Social-Bot on Twitter through User’s Content Approach2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Stance Detection Attending External Knowledge from Wikipedia2019

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[学会発表] 大規模言語モデルにおける評価バイアスの尤度に基づく緩和2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 自然言語処理の基礎2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Semantic Specialization for Knowledge-based Word Sense Disambiguation2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Selective-LAMA: Selective Prediction for Confidence-Aware Evaluation of Language Models2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Comparative evaluation of boundary-relaxed annotation for Entity Linking performance2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Generative Data Augmentation for Aspect Sentiment Quad Prediction2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 生成AIによる新しい医療言語処理: 創薬から臨床まで2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模言語モデル ～ 言語モデルと自然言語処理のフロンティア2023

著者名/発表者名

岡崎直観東京工業大学, 情報理工学院, 教授 (50601118)

[学会発表] 大規模言語モデル～言語モデルと自然言語処理のフロンティア2023