研究課題/領域番号 |
18K11572
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62030:学習支援システム関連
|
研究機関 | 徳島大学 |
研究代表者 |
佐野 雅彦 徳島大学, 情報センター, 准教授 (00274259)
|
研究分担者 |
上田 哲史 徳島大学, 情報センター, 教授 (00243733)
松浦 健二 徳島大学, 情報センター, 教授 (10363136)
大平 健司 大阪大学, 情報推進本部, 准教授 (40515326)
谷岡 広樹 徳島大学, 情報センター, 講師 (90785106)
|
研究期間 (年度) |
2018-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2019年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 研究成果物分類 / ゼミ話者推定 / 研究成果物自動収集 / 研究分野分類 / 議事録検索効率化 / トランスクリプト検索 / 研究室配属支援 / ゼミ議事録利活用 / 論文執筆支援 / 計算論的思考力測定 / Mahara機能拡張 / RDFメタ情報 / 研究成果物検索 / 持続的研究活動支援 / 研究活動効率化支援 / 知識継承と知識流通 / eポートフォリオシステム |
研究実績の概要 |
①「研究成果物蓄積システム」における成果物自動分類の精度改善ため,本年度は異なるアプローチとして,縮小画像を用いた分類手法について検討・評価を実施した。これは,PDF化された論文やスライドの文書ファイルをページ単位に切り出し,32×32のグレイスケール縮小画像に変換した後,機械学習にて分類するものである。「縮小画像による研究成果物分類手法」では,3層CNNを用いて,論文(レポート等を含む)とスライドの2クラス分類において,未知データにおいて正解率97.9%が得られ一定の成果が得られた。 また,研究室等のPC等に保存された成果物の自動集収・検索する仕組みをPyhtonにより実装を行い,支援システム全体におけるデータ収集部分を実装を進めた。 ②ゼミ会話履歴の抽出自動化の試みとして単一マイク記録からの自動文字化結果からの発言単位の話者推定を試みた。教員と学生の2者間会話を前提として,形態素解析,ランダムフォレスト法等による分類を行った結果,名詞及び発言時間の組み合わせにより7割程度の識別結果が得られた。しかし文字化精度が不十分であったため,より精度の良いサービスを利用するか,精度が不十分であっても分類可能なアルゴリズムの検討が必要である。 ③本課題から派生した関連研究として,「論理構造に着目したWebサーバのアクセス制御設定の学習支援」においては,Webにおけるアクセス制御の考え方の学習を支援するもので,本研究における研究活動支援および技術項目であるアクセス制御に関連するものである。「Security Impact Analysis of Degree of Field Extension in Lattice Attacks on Ring-LWE Problem」では,アクセス制御におけるセキュリティ問題として,RING-LWE問題を対象としたセキュリティ影響分析を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
①について2クラス分類においては良好な結果が得られており,現在3クラス以上での分類を試みている。クラス数の増加による計算量の増加やCNNモデルの複雑化が想定されるため,分類が難しい内容によっては文字情報解析を併用した分類も検討している。また,今年度実装した自動収集プログラムにおいては,PC内の指定フォルダ等の情報をDBに集約化することができたがWeb上のデータの収集については検討中である。 ②について,大学等で広く利用されているMS社のTeamsをゼミの記録に用いているが,他の商用サービスと比較したところ,文字化情報の精度が低いと判断された。これはマイク設備等の環境にも依存しているため継続して検討する。このため,単一マイク入力によるゼミ会話における話者推定の精度は十分ではなく改善が必要である(話者毎にマイク設置する場合は対応は簡単となるが,同一部屋内でのマイクON/OFFは煩雑となることから,同一部屋内では単一マイクが妥当であると考えている)。 ③については派生研究であり,今後の展開が期待できる。
|
今後の研究の推進方策 |
①について,3クラス以上の分類を試行し,縮小画像分類では難しい部分を文字解析による分類で補うことを計画している。また,実装しているPC等から自動収集するプログラムと組み合わせ,研究成果物の自動収集及び自動分類化を進める。加えて,大規模言語モデル等による成果物の要約化によるメタデータ付与についても検討する。メタデータが増えることにより利活用する際の利便性の向上を期待している。 ②について,これはマイク設備等の環境にも依存しているため継続して検討するが,同一部屋内における会話としては発言の都度マイクON/OFFすることは煩雑であるため,単一マイク集音による文字化が妥当と判断しており,文字化精度の向上(発言内容の話題分析に影響)と発言者推定の向上を検討する。また,会話音声の文字化精度についても,現状では他の商用サービスが優位であるが,低コストで広く利用できるメリットを考慮すると,現状の精度で話者分類可能なアルゴリズムを検討する必要がある。その際,文字化情報からの話題分析等についても,精度が低い情報からの話題分析に適したアルゴリズムを再選択する必要があると判断している。 以上,①②を踏まえてシステム統合し評価を行っていく。 ③については派生研究であり,今後の展開を検討する。
|