研究課題/領域番号 |
18K02837
|
研究機関 | 金沢工業大学 |
研究代表者 |
武市 祥司 金沢工業大学, 情報フロンティア学部, 教授 (90291319)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | スピーチ / セマンティック構造 / 可視化 / 人工知能 |
研究実績の概要 |
ショートスピーチのセマンティック構造を解析するための事前準備として,まずは動画データから音声を抽出してテキストデータに変換するための既存ツールの調査比較を実施した.音声-テキスト変換を行う市販ツールおよびネット・サービスとして広く利用されている(1)Dragon Speech 11,(2)AmiVoice SP2,(3)IBM Speech to Text,(4)Google Cloud Platform Speech-to-Text,(5)Just Press Recordの5種の変換精度を調査した.その結果,認識率が30%程度の(1)(2)と比較して,(3)~(5)は60~90%と高い認識率を有しており,これらの既存ツールを利用することが有望であることが判明した. さらに,自己紹介と大学入学後の自己の成長に関する約10分間の学生スピーチ24件を分析対象として,これらのスピーチの頻出語,tf-idf(term frequency-inverse document frequency)分析による重要語,共起ネットワーク分析による中心語などを抽出した.さらに,共起ネットワークの時間発展も追跡した.さらに,対象スピーチのわかりやすさについて,複数名が評価して,その評価を平均して「わかりやすい」「どちらともいえない」「わかりにくい」に3分類した.この「わかりやすい」スピーチと「わかりにくい」スピーチについて,上記の分析結果の差異を明らかにすることを試みた.その際に,「わかりやすいスピーチは,発表全体の重要語が,スピーチ冒頭(発表開始70秒後まで)に含まれている」などの10の仮説を提案して検証を試みた.その結果,いくつかの仮説は妥当であるとの結果が得られ,わかりやすいスピーチ,およびわかりにくいスピーチには,それぞれ特有のセマンティック構造があることが示唆された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画調書における初年度の実施項目に関しては,人工知能活用のための準備についてはやや遅れがあるものの,その他に関してはおおむね予定通りに進展している.人工知能活用のための準備が遅れた理由は,データの整備と高性能の計算機環境の構築に想定以上に時間がかかったためである. なお,初年度の成果に関しては,2019年9月に開催される公益社団法人日本工学教育協会第67回年次大会にて発表予定である.
|
今後の研究の推進方策 |
昨年度以来実施している「わかりやすい」スピーチと「わかりにくい」スピーチの差異をさらに明らかにすることを本年度も継続する. さらに昨年度末に構築した人工知能用の計算機環境において,出現語の抽出やインデックス作成等を実施し,これらの過去のスピーチのデータを参照データとして学習させる.これらの学習結果に対して,新規のスピーチデータを入力すると,最も参考となる参照スピーチを提示できるかどうかを検証する.さらに,参照スピーチのセマンティック構造の可視化結果を提示し,差異を視覚的に捉えられるようすることを試みる.
|