研究課題/領域番号 |
21K18115
|
研究種目 |
挑戦的研究(開拓)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 静岡大学 |
研究代表者 |
狩野 芳伸 静岡大学, 情報学部, 准教授 (20506729)
|
研究分担者 |
酒井 邦嘉 東京大学, 大学院総合文化研究科, 教授 (10251216)
福井 直樹 上智大学, 言語科学研究科, 教授 (60208931)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
25,870千円 (直接経費: 19,900千円、間接経費: 5,970千円)
2023年度: 9,100千円 (直接経費: 7,000千円、間接経費: 2,100千円)
2022年度: 8,320千円 (直接経費: 6,400千円、間接経費: 1,920千円)
2021年度: 8,450千円 (直接経費: 6,500千円、間接経費: 1,950千円)
|
キーワード | 自然言語処理 / 脳科学 / 認知科学 / 言語学 / 理論言語学 / 話し言葉 |
研究開始時の研究の概要 |
人間の言葉を計算機で処理する自然言語処理と脳科学の研究を融合させ、より人間に近い言語処理モデルを構築すると共に、話し言葉解析器を実装し、諸分野で応用検証する。既存の言語処理とは根本的に異なる、小規模データで学習可能な話し言葉解析器を軸にして、言語学・科学(人間の言語処理モデルの解明)、工学(解析器の実装)、さらに各分野での応用までつながった新たな研究を創成するのが目的である。人間ははるかに小規模のデータで学習可能と考えられるため、工学的応用としても大きな意義がある。
|
研究成果の概要 |
本研究の目標は、脳科学の知見を導入したより人間に近い言語処理モデルを構築することである。理論言語学の知見に基づきfMRI実験の課題をデザインし、構文や語順を題材に実験を行った。広くAI分野で用いられているTransformerとその亜種では内部で個別情報をどう処理しているか定かでないため、言語学的な機能との対応を分析した。Transformerには明示的なメモリ(記憶)がなく、必要とする学習データ量も人間に比べ桁違いに大きく冗長な可能性があること、またその内部表現の解釈が困難なことから、リカレントネットワークの記憶に明示的な解釈を強制したモデルを構築し実験を行った。
|
研究成果の学術的意義や社会的意義 |
人間の仕組みからは遠い人工的なモデルが工学的応用の主流となっている現状に対し、脳科学・認知科学と理論言語学、自然言語処理の接点を見いだし3者の知見を融合した新たなモデルを構築する糸口とすることができた。このような試みでは、より大規模な工学的モデルと個別タスクでの性能比較によってその時々では劣って見えてしまうことが多いが、「より人間に近い言語モデル」という理学的モチベーションは、長期的なブレークスルーの可能性を見据えた「人間との親和性」「説明可能AI」という工学的側面においても意義があり、広く社会的意義のある研究成果といえる。
|