2020 Fiscal Year Annual Research Report
IImprovement of Student's Speech Skills Assisted by Artificial Intelligence based on Visualization of Semantic Structure and Reference Data of Good Speech
Project/Area Number |
18K02837
|
Research Institution | Kanazawa Institute of Technology |
Principal Investigator |
武市 祥司 金沢工業大学, 情報フロンティア学部, 教授 (90291319)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | スピーチ / セマンティック構造 / AI |
Outline of Annual Research Achievements |
本年度は,自然言語処理に関するAI技術を用いて,優良スピーチと非優良スピーチの識別,さらに優良スピーチの中で最も参考となると考えられる参照スピーチの適切な選定の可能性を主に検討した.具体的には,入手できたサンプル・スピーチのテキストを用いて,高性能かつ利用が比較的容易な自然言語処理モデルを用いた.近年広く用いられるようになったプログラム言語Pythonの深層学習ライブラリであるKerasを用いて, LSTM(Long Short Term Memory)ネットワーク・モデル,BERT(Bidirectional Encoder Representations from Transformers)モデルの2つを実装して,サンプルのテキストデータを学習させて,識別精度の比較と参照スピーチの選定の妥当性の検証を行った.今回の検証では,いずれのAIモデルにおいても,優良と非優良の識別精度は低い結果となったが,BERTの方がやや良い傾向がみられることが判明した.また,参照スピーチを選定においても十分に妥当であると言えるような結果は得られなかった.この理由の一つは,前年度までに明らかになったセマンティック構造の違いを反映したというよりも,出現語句の有無とその頻度に引きずられて類似度が評価される識別判定が導き出されていると考察される.これら十分とはいえない成果の理由の一つは,学習に用いたサンプルデータの数の少なさと考えられる.今回は,自己紹介と大学入学後の自己の成長に関する約10分間の学生のスピーチという特定の範囲に対象を絞って検討を実施したが,COVID-19の影響およびスピーチした学生の使用許諾権の問題があったために,サンプル数を増やすことが出来なかったので,学習サンプル数を増やしての再学習後の検討を今後の課題とする.
|