研究課題/領域番号 |
21K12141
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 徳島大学 |
研究代表者 |
吉田 稔 徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (40361688)
|
研究分担者 |
北 研二 徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10243734)
松本 和幸 徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (90509754)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | 数値情報解析 / SNS分析 / 画像とテキストの関連分析 / テキスト中の数値解析 / 用語抽出 |
研究開始時の研究の概要 |
本研究提案は、SNS上における、専門的な話題に関する人々の発言を対象に、特に数値および専門用語に着目し、その重要度や用語・数値間の関係を抽出するための手法を研究・開発するものである。人々が関心を持っている専門用語や数値(トレンド)を発見するとともに、(1)発言者の専門性を考慮する、(2)発言において参照されている論文等のエビデンスがあれば、それを分析する、等の手法を通じ、それら専門用語・数値間の関係や、各用語の重要性、専門知識の中における位置づけ(文脈)を反映した単語表現(単語の意味のベクトル表現)を学習し、用途に応じて適切な用語・数値を提示することを目的とする。
|
研究実績の概要 |
今年度は、Transformerモデルに基づく生成AIの研究が世界的に急速に発展し、日本語のモデルに関しても、様々な団体から無償で利用可能なモデルが公開されたことを受け、それに対応するための研究を行った。 特に、GPT言語モデルの言語生成に焦点を当て、その生成の仕組みを明らかにするための研究を行った。この分析を応用することで、生成的言語モデルによる数値の生成や、数値がTransformer言語モデルでどのように理解されているのかの分析が可能になる。また、数値分析に関する研究として、宿泊予約サイトの評価スコアとテキストの関連分析を、観点(設備や部屋等)毎に行う研究も行った。そのほか、テキストと数値情報および投稿者プロフィールとの関連を分析する研究として、育児関連のSNSテキストから、テキスト中に登場する子供の年齢との相関を分析する研究も行った。 また、今年度は、感情分析に関する新たな研究を行った。Yahoo!知恵袋を分析対象とし、社会的な出来事と投稿の感情分布がどのように相関しているかの研究を行ったほか、COVID-19の流行前と流行後で人々の感情がどのように変化したかや、人々の興味・関心がどのように変化したかの分析を、ユーザーの性格毎に分類したSNSのテキストを用いることで行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は、生成AIの爆発的な発展により、研究計画をそれに応じた物に変更することになったが、生成AIの仕組みに関する分析が順調に進展したことで、各団体が公開している無償利用の生成AIモデルを、本研究提案に活かすことが可能になったと考える。
|
今後の研究の推進方策 |
今年度得られた知見をもとに、各団体の公開する無償利用可能な生成AIモデルを分析し、Transformer言語モデルを利用した数値知識理解の技術を開発する。これをもとに、論文中の数値情報を分析し、人が理解できる形への変換を目指す。また、これまで得られた技術を最終的に統合することを目指す。
|