研究課題/領域番号 |
21K18115
|
研究種目 |
挑戦的研究(開拓)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 静岡大学 |
研究代表者 |
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
|
研究分担者 |
酒井 邦嘉 東京大学, 大学院総合文化研究科, 教授 (10251216)
福井 直樹 上智大学, 言語科学研究科, 教授 (60208931)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
25,870千円 (直接経費: 19,900千円、間接経費: 5,970千円)
2023年度: 9,100千円 (直接経費: 7,000千円、間接経費: 2,100千円)
2022年度: 8,320千円 (直接経費: 6,400千円、間接経費: 1,920千円)
2021年度: 8,450千円 (直接経費: 6,500千円、間接経費: 1,950千円)
|
キーワード | 自然言語処理 / 脳科学 / 認知科学 / 言語学 / 理論言語学 / 話し言葉 |
研究開始時の研究の概要 |
人間の言葉を計算機で処理する自然言語処理と脳科学の研究を融合させ、より人間に近い言語処理モデルを構築すると共に、話し言葉解析器を実装し、諸分野で応用検証する。既存の言語処理とは根本的に異なる、小規模データで学習可能な話し言葉解析器を軸にして、言語学・科学(人間の言語処理モデルの解明)、工学(解析器の実装)、さらに各分野での応用までつながった新たな研究を創成するのが目的である。人間ははるかに小規模のデータで学習可能と考えられるため、工学的応用としても大きな意義がある。
|
研究実績の概要 |
本研究の目標は、脳科学の知見を導入したより人間に近い言語処理モデルを構築することである。 言語野には「文法・読解・音韻・単語」から成る4つの言語中枢が同定されている。また、分担者(酒井)らの研究で文法関連ネットワークは少なくとも3つあることが明らかとなっている。機能的MRI(fMRI)などによる脳機能計測と機能結合(functional connectivity)の解析により、これら3つの脳内ネットワークがどのように融合されているかを明らかにする。fMRI実験の課題は、分担者(福井)を中心に、理論言語学の知見に基づきデザインし、代表者が構文や語順を題材に実験の素材となるデータを提供して実行した。 自然言語処理分野では、ほとんどすべての生成AIがそうであるように、多くのシステムでTransformerとその亜種が用いられているが、Transformerアーキテクチャがその内部で個別の情報をどのように処理しているかは定かでないため、様々な実験設定で言語学的な機能との対応を分析した。 Transformerには明示的なメモリ(記憶)がなく、必要とする学習データ量も人間に比べ桁違いに大きく冗長な可能性があること、またその内部表現の解釈が困難なことから、リカレントネットワークの記憶に明示的な解釈を強制したモデルを構築し実験を行った。 さらに、文字情報に明示的に現れない読解時の間(ポーズ)の予測を行い、話し言葉が基盤である人間の言語処理とのギャップ解消を試みた。
|