研究課題/領域番号 |
16K00702
|
研究機関 | 埼玉工業大学 |
研究代表者 |
田中 克明 埼玉工業大学, 人間社会学部, 准教授 (80376657)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 時系列文書処理 / デジタルストーリーテリング / 音声情報蓄積 / テキストマイニング / 知能情報学 |
研究実績の概要 |
本研究では、複数の人間が情報の蓄積に関わる状態において、通時的に、情報蓄積の焦点となる対象を設け、情報が建設的に蓄積される枠組みを構築することを目的とする。2018年度は、2017年度に引き続き、音声情報を蓄積する手法の研究、および、時間の経過に沿って蓄積されたテキストを対象とした、議論が建設的に行われているかを確認する手法の研究を行った。 音声により情報を蓄積するシステムでは、APIとして一般公開されている音声認識機能を利用し、録音した音声をテキストに変換して表示するようにシステムを改め、実験を行った。これにより、波形表示のみと比べて、蓄積されている音声を聴取しようとする際の利便性の向上は確認できた。しかし、波形とテキストを並べて表示する簡単なインタフェースを採用したためか、新たに蓄積音声を聴取しようとする「きっかけ」を作ることには、有用ではなかった。 時間の経過に沿って蓄積されたテキストにおいて、議論が建設的であるかを確認する手法の研究では、議論内容の2次元レイアウトアニメーション手法の調整を行いつつ、通時的な対象を抽出する手法の研究を進めた。ここでは、通時的な対象の抽出は、「文書中に現れる通時的な対象には、異なるタイミングで類似した言及がなされる」と仮定することにより行った。抽出された結果が通時的な対象とみなせるか、出現率の高い単語と比較して評価を行い、この仮定に基づく手法により、通時的対象の抽出が可能であることが分かった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2018年度は、研究実績の概要にも述べたように、2017年度に推進方策として挙げた、音声情報蓄積システムの改良と、通時的対象が文書情報の蓄積に及ぼす影響の評価を行う手法の検討を進めた。しかし、全体の関係性を整理し、フレームワークとしてまとめる部分に遅れがある。例えば、音声情報の件数は百件程度であるのに対し、通時的対象の抽出を試みた文書情報の件数は数千件と規模が異なっており、蓄積内容の2次元アニメーションを音声情報へ適用することが難しい、などの問題がある。これらは主に利用者が操作するインタフェースでの情報提示手法に関連するため、提示手法の切り替えを含めつつ、規模の異なるデータを共通に提示する仕組みの構築を進めている。また、同様の理由により、通時的対象なしで蓄積された情報と、本研究を通して蓄積された情報の相違に関する検討にも、遅れがある。 一方、通時的対象を蓄積された情報から抽出する手法の研究に伴い、通時的な対象の定義をあらためて行えたため、研究成果発表の準備を進めている。
|
今後の研究の推進方策 |
2018年度に進めた通時的対象の抽出手法の確立を中心に、これまでに行った研究を組み合わせ、フレームワークとして再整理を行う。このために、進捗状況にも記述した、規模の異なるデータへの各手法の適用方法の再確認と、利用者が操作するインタフェースの整理を進める。 また、散発的な議論から通時的な対象を検出し、これを情報記述のターゲットとした上で情報の蓄積を継続させるシステムを、フレームワークの適用例として構築する。これにより、通時的対象なしで蓄積された情報と、本研究を通して蓄積された情報の相違に関して、定性的な評価を進める。
|
次年度使用額が生じた理由 |
ソフトウェアの外注を行わず内部での制作を進める一方、データ処理用の計算機と実験環境の調達を進めたこと、被験者実験は謝金の支出なしで行ったこと、国際会議における研究発表を2019年度に実施予定としたことなどにより、計画との差額が発生した。2019年度は、国際会議における発表のための旅費、評価実験用の計算機調達を予定している。
|