| 研究課題/領域番号 |
22K12285
|
| 研究種目 |
基盤研究(C)
|
| 配分区分 | 基金 |
| 応募区分 | 一般 |
| 審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
| 研究機関 | 国立情報学研究所 |
研究代表者 |
須田 永遠 国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (40933411)
|
| 研究分担者 |
栗田 和宏 名古屋大学, 情報学研究科, 助教 (40885266)
武富 有香 国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (60941101)
|
| 研究期間 (年度) |
2022-04-01 – 2027-03-31
|
| 研究課題ステータス |
交付 (2024年度)
|
| 配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2026年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
| キーワード | ソーシャルメディア / 異分野融合 / ナラティブ / 列挙アルゴリズム / 意味解釈 / 心的状態 / 言語的特徴 / 人々の関心の変化 / ナラティヴの類型 / テキストマイニング / 準最適解の列挙 / SNS / 文体論 / ナラティヴ |
| 研究開始時の研究の概要 |
ソーシャルメディア上のテキストを解析するための日本語文体論を構築することを目指して、これまでSNS解析や自然言語処理で捉えることが難しいとされてきた意図や心理の問題に、文学研究が扱うような書き手の文章的特徴からアプローチを行う。具体的には人間の感情が表出していると思われるテキストサンプルをSNS上で収集し、発話されたコンテキストに着目しながらトピックごとに共通する言語的特徴を割り出す。従来の文体論の知見をSNS解析に応用可能なものとすることを念頭に、情報学と文学の研究者が協働して遂行する。
|
| 研究実績の概要 |
本年度は、主に以下の4点から研究を遂行し、成果を発表した。 (i)大規模 SNS データの分析:新型コロナワクチンに関する大規模ツイートを対象に、クラスタリング・読解・頻度解析を組み合わせた話題推移の検証を行い、査読付き論文として公表した。また、分析手法について複数の国内研究会で報告を行った。 (ii)「ナラティブ」読解理論の整理:文学研究で培われた物語論のフレームワークを、計算機応用との関連で整理し、複数の研究会で報告を行った。 (iii)研究コミュニティ形成と学際的アウトリーチ:上記(i),(ii)の成果を複数の情報系研究会で報告し、議論する中で、人文学と他分野との連携を推進するための議論の場の必要性を認識し、共同代表として研究会を創設、議論会の主催と運営を行った。また、「ナラティブと人工知能」をテーマとする特集号を企画・編集し、関連分野の研究者を集めた。 (iv)テキストマイニング技術の基礎となるアルゴリズムの開発:大量のテキストデータから書き手の心的状態と結びついた言語的特徴の累計を析出するには、まず限られたテキストを人手で解釈する必要があるが、その際にはある条件を満たす文を効率よくマイニングする情報学的な技術が必須である。前年度に引き続き、こうした技術を下支えするアルゴリズムの開発を行った。
|
| 現在までの達成度 |
現在までの達成度
2: おおむね順調に進展している
理由
SNSデータの解析を査読付き論文として公表し、複数の研究会で手法を報告して得られたフィードバックにより、方法論の妥当性と改善点を検証できた。物語論のフレームワークの整理も発表を経て着実に進展し、当初の目標に近づいている。さらに学際研究会の創設と特集号の企画・編集によって人文学と情報学を結ぶコミュニティ基盤を構築した。国際学会発表や生成 AI 活用など今後の課題は残るものの、主要項目を概ね達成しており、全体として「おおむね順調に進展している」と評価できる。
|
| 今後の研究の推進方策 |
次年度は主に以下の2点に留意しつつ研究を推進していく。 (i) ワクチンのトピックで確立した分析手法を、ジェンダーや科学技術など、他の社会的関心事に関するSNSデータに適用し、方法論の妥当性の検証と、心的状態と言語表現との関係の分析を行う。 (ii) 大規模言語モデルによる自動タグ付けと研究メンバーによる検証を組み合わせ、読解、ラベル付与を半自動化させるための方法論を模索する。
|