文脈理解可能な「AI話しことばチェッカー」の開発と実証評価
Project/Area Number |
23K24961
|
Project/Area Number (Other) |
22H03706 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 62030:Learning support system-related
|
Research Institution | Teikyo University |
Principal Investigator |
山下 由美子 帝京大学, 公私立大学の部局等, 准教授 (90635294)
|
Co-Investigator(Kenkyū-buntansha) |
小松川 浩 公立千歳科学技術大学, 理工学部, 教授 (10305956)
湯川 治敏 愛知大学, 地域政策学部, 教授 (40278221)
秋山 英治 愛媛大学, 法文学部, 教授 (40636148)
日永 龍彦 山梨大学, 大学院総合研究部, 教授 (60253374)
加藤 竜哉 愛知大学, 公私立大学の部局等, 研究員 (70624542)
仲道 雅輝 愛媛大学, 教育・学生支援機構, 准教授 (90625279)
山川 広人 公立千歳科学技術大学, 理工学部, 講師 (90724732)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥15,730,000 (Direct Cost: ¥12,100,000、Indirect Cost: ¥3,630,000)
Fiscal Year 2026: ¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
Fiscal Year 2025: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2024: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2023: ¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2022: ¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
|
Keywords | 話しことばチェッカー / 話し言葉 / 学習支援システム / レポート / AI / 初年次 / 機械学習 / システム開発 |
Outline of Research at the Start |
先行研究を通じて話し言葉を分類カテゴリに沿って検出できる「話しことばチェッカー」システムを開発し,反転学習と協調学習を組み合わせた授業実践により,文脈の影響を受けるあいまいな話し言葉抽出の可能性を示した。本研究では,こうした授業を一元的に管理できる学習支援システムと授業モデルを構築し,複数大学での実践を通じて,あいまいな話し言葉の効率的な抽出とともに教育的効果を検証する。その上で,授業実践で蓄積された大量のあいまいな話し言葉の事例データベースに機械学習を適用させ,文脈理解可能な「AI話しことばチェッカー」を開発し,知的学習支援システムへの拡張を目指す。
|
Outline of Annual Research Achievements |
2021年度までの研究で、判定対象の文章内に含まれる話し言葉を、作成した話し言葉の分類カテゴリに沿って検出し、修正文例を提示する機能を搭載した話し言葉検出システム「話しことばチェッカー」を開発した。 今年度からの研究では、反転と協調学習を組み合わせた授業モデルの構築と大規模な実践を図り、そこで得られる文脈の影響を受けるあいまいな話し言葉事例ベースに基づき、最適化された文脈理解可能な「AI話しことばチェッカー」を有する知的学習支援システムの実現を目指す。2022年度は主に、あいまいな表現(グレーゾーン)の抽出作業およびそれらを検出できるよう、システムのAI化に向けた検証を行った。あいまいな表現(グレーゾーン)とは、対象となる言葉が話し言葉であるか否かの文脈判断が必要な表現を指す。その例として、「てしまう」が挙げられる。この表現は、主語が「私」であれば主観的になりやすく、主語が第三者であれば客観性が保たれやすい。他には、「残念」「面倒」「つらい」「厳しい」など、個人の感情が介入しやすい表現や若者言葉や流行語として口語的に使われる表現などである。 今年度は、「てしまう」を題材に、機械学習モデルを構築し、Amazonレビューや査読論文などから作成した4種類のデータセットを用いて評価を行った。まず、抽出した「てしまう」を含む主観的な文と客観的な文それぞれ250文ずつを、ファインチューニングしたデータセットに研究代表者の分類した「てしまう」データセットを推論させたところ、77%の精度を出すことができた。このことから、Amazonレビューと学会の査読論文の文章が、研究代表者の作成した「てしまう」データセットの分類と近い可能性が示唆された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
あいまいな話し言葉(グレーゾーン)抽出のために、試作的に実施した「てしまう」の判別で77%の精度を出すことができ、グレーゾーン判別モデルの基礎を作ることができた。 これにより、その他のあいまいな話し言葉の判定も同様に進めていけることがわかった。 現在は、「てしまう」以外のあいまいな話し言葉抽出に加え、まだ選定できていないあいまいな話し言葉を探している状況である。
|
Strategy for Future Research Activity |
現在までのところ概ね順調に進んでいるが、学生の文章からの実例抽出のためにも、研究分担者以外にも「話しことばチェッカー」の利用を促すよう周知を進めていきたい。 また機械学習を重ね、判定精度をより高めていく。
|
Report
(1 results)
Research Products
(6 results)