数値および専門性と話題性に着目したSNSからの科学的知識抽出に関する研究
Project/Area Number |
21K12141
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62020:Web informatics and service informatics-related
|
Research Institution | The University of Tokushima |
Principal Investigator |
吉田 稔 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (40361688)
|
Co-Investigator(Kenkyū-buntansha) |
北 研二 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10243734)
松本 和幸 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (90509754)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
|
Keywords | 数値情報解析 / SNS分析 / 画像とテキストの関連分析 / テキスト中の数値解析 / 用語抽出 |
Outline of Research at the Start |
本研究提案は、SNS上における、専門的な話題に関する人々の発言を対象に、特に数値および専門用語に着目し、その重要度や用語・数値間の関係を抽出するための手法を研究・開発するものである。人々が関心を持っている専門用語や数値(トレンド)を発見するとともに、(1)発言者の専門性を考慮する、(2)発言において参照されている論文等のエビデンスがあれば、それを分析する、等の手法を通じ、それら専門用語・数値間の関係や、各用語の重要性、専門知識の中における位置づけ(文脈)を反映した単語表現(単語の意味のベクトル表現)を学習し、用途に応じて適切な用語・数値を提示することを目的とする。
|
Outline of Annual Research Achievements |
今年度は、Transformerモデルに基づく生成AIの研究が世界的に急速に発展し、日本語のモデルに関しても、様々な団体から無償で利用可能なモデルが公開されたことを受け、それに対応するための研究を行った。 特に、GPT言語モデルの言語生成に焦点を当て、その生成の仕組みを明らかにするための研究を行った。この分析を応用することで、生成的言語モデルによる数値の生成や、数値がTransformer言語モデルでどのように理解されているのかの分析が可能になる。また、数値分析に関する研究として、宿泊予約サイトの評価スコアとテキストの関連分析を、観点(設備や部屋等)毎に行う研究も行った。そのほか、テキストと数値情報および投稿者プロフィールとの関連を分析する研究として、育児関連のSNSテキストから、テキスト中に登場する子供の年齢との相関を分析する研究も行った。 また、今年度は、感情分析に関する新たな研究を行った。Yahoo!知恵袋を分析対象とし、社会的な出来事と投稿の感情分布がどのように相関しているかの研究を行ったほか、COVID-19の流行前と流行後で人々の感情がどのように変化したかや、人々の興味・関心がどのように変化したかの分析を、ユーザーの性格毎に分類したSNSのテキストを用いることで行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度は、生成AIの爆発的な発展により、研究計画をそれに応じた物に変更することになったが、生成AIの仕組みに関する分析が順調に進展したことで、各団体が公開している無償利用の生成AIモデルを、本研究提案に活かすことが可能になったと考える。
|
Strategy for Future Research Activity |
今年度得られた知見をもとに、各団体の公開する無償利用可能な生成AIモデルを分析し、Transformer言語モデルを利用した数値知識理解の技術を開発する。これをもとに、論文中の数値情報を分析し、人が理解できる形への変換を目指す。また、これまで得られた技術を最終的に統合することを目指す。
|
Report
(3 results)
Research Products
(43 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] A System to Correct Toxic Expression with BERT2022
Author(s)
Motonobu Yoshida, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita
Organizer
Proceedings of the 14th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KEOD(Web会議)
Related Report
Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-