2022 Fiscal Year Annual Research Report
文脈理解可能な「AI話しことばチェッカー」の開発と実証評価
Project/Area Number |
22H03706
|
Allocation Type | Single-year Grants |
Research Institution | Teikyo University |
Principal Investigator |
山下 由美子 帝京大学, 公私立大学の部局等, 講師 (90635294)
|
Co-Investigator(Kenkyū-buntansha) |
小松川 浩 公立千歳科学技術大学, 理工学部, 教授 (10305956)
湯川 治敏 愛知大学, 地域政策学部, 教授 (40278221)
秋山 英治 愛媛大学, 法文学部, 教授 (40636148)
日永 龍彦 山梨大学, 大学院総合研究部, 教授 (60253374)
仲道 雅輝 愛媛大学, 教育・学生支援機構, 准教授 (90625279)
山川 広人 公立千歳科学技術大学, 理工学部, 講師 (90724732)
加藤 竜哉 愛知大学, 公私立大学の部局等, 研究員 (70624542)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Keywords | 話しことばチェッカー / 話し言葉 / レポート / 初年次 / 学習支援システム / 機械学習 / AI |
Outline of Annual Research Achievements |
2021年度までの研究で、判定対象の文章内に含まれる話し言葉を、作成した話し言葉の分類カテゴリに沿って検出し、修正文例を提示する機能を搭載した話し言葉検出システム「話しことばチェッカー」を開発した。 今年度からの研究では、反転と協調学習を組み合わせた授業モデルの構築と大規模な実践を図り、そこで得られる文脈の影響を受けるあいまいな話し言葉事例ベースに基づき、最適化された文脈理解可能な「AI話しことばチェッカー」を有する知的学習支援システムの実現を目指す。2022年度は主に、あいまいな表現(グレーゾーン)の抽出作業およびそれらを検出できるよう、システムのAI化に向けた検証を行った。あいまいな表現(グレーゾーン)とは、対象となる言葉が話し言葉であるか否かの文脈判断が必要な表現を指す。その例として、「てしまう」が挙げられる。この表現は、主語が「私」であれば主観的になりやすく、主語が第三者であれば客観性が保たれやすい。他には、「残念」「面倒」「つらい」「厳しい」など、個人の感情が介入しやすい表現や若者言葉や流行語として口語的に使われる表現などである。 今年度は、「てしまう」を題材に、機械学習モデルを構築し、Amazonレビューや査読論文などから作成した4種類のデータセットを用いて評価を行った。まず、抽出した「てしまう」を含む主観的な文と客観的な文それぞれ250文ずつを、ファインチューニングしたデータセットに研究代表者の分類した「てしまう」データセットを推論させたところ、77%の精度を出すことができた。このことから、Amazonレビューと学会の査読論文の文章が、研究代表者の作成した「てしまう」データセットの分類と近い可能性が示唆された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
あいまいな話し言葉(グレーゾーン)抽出のために、試作的に実施した「てしまう」の判別で77%の精度を出すことができ、グレーゾーン判別モデルの基礎を作ることができた。 これにより、その他のあいまいな話し言葉の判定も同様に進めていけることがわかった。 現在は、「てしまう」以外のあいまいな話し言葉抽出に加え、まだ選定できていないあいまいな話し言葉を探している状況である。
|
Strategy for Future Research Activity |
現在までのところ概ね順調に進んでいるが、学生の文章からの実例抽出のためにも、研究分担者以外にも「話しことばチェッカー」の利用を促すよう周知を進めていきたい。 また機械学習を重ね、判定精度をより高めていく。
|
Research Products
(6 results)