研究課題/領域番号 |
22K18010
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62030:学習支援システム関連
|
研究機関 | 拓殖大学 |
研究代表者 |
西垣 貴央 拓殖大学, 工学部, 助教 (40803523)
|
研究期間 (年度) |
2022-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2026年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2025年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2024年度: 130千円 (直接経費: 100千円、間接経費: 30千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 情報抽出 / データマイニング / テキストマイニング / 独立話題分析 / 情報閲覧システム / インタラクティブ / 学習支援 |
研究開始時の研究の概要 |
膨大な量のデータがインターネット上に存在しているため人にとって本当に有用なデータなのか,不要なデータなのかの取捨選択は非常に煩雑である.またそのデータが真実のデータなのか,虚偽のデータなのかのチェックも必要になっている.しかし急激に高度情報化社会に突入したことにより,データの真偽や信頼性を適切に評価する方法を,人に教育することができておらず,多くの人は適切にデータの真偽や信頼性を評価できない.そこで本研究では,計算機による信頼性の高い情報の抽出を人と対話的に行うことで,人が抽出された情報の真偽や信頼性の推定ノウハウの学習を支援するシステムの開発を行う.
|
研究実績の概要 |
初年度の研究実績としては,多くの情報の中から有用な情報を抽出する方法として,まずは複数の分野において,膨大な量のデータから人にとって有用な情報を抽出する方法の提案および作成を行った.これは現在人が行っている作業を,機械が人の代わりに人と同等の結果を得ることを目的としている. 具体的には,①商船に搭載された航海機器や無線機器の異常予兆検知を行う研究および,②ピアノ演奏者の運指を機械学習手法を用いて推定する研究について行った. ①については,商船には多くの航海機器や無線機器が搭載されており,機器が航海の途中で故障すると非常に困る.そのため航海機器や無線機器が壊れる前に壊れる予兆(異常予兆)を検出することが求められている.そこでそれらの機器に異常予兆があらわれているかどうかを機械学習手法を用いて検討を行った.機械学習手法としてMT法とOne-Class SVM(OCSVM)を用いて異常予兆が検知できるかを行い,それぞれの結果の比較を行った.両手法とも外れ値に関しては異常予兆として検出が可能であった.またOCSVMに関しては外れ値の前後のデータにおいても異常予兆を検知しており,外れ値が機器の故障である場合,外れ値前後も検出できるOCSVMのほうが実用的であるという結果となった. ②については,ピアノ演奏初心者は正しい指使いができておらず,運指が記載されていない楽譜を見てもどの指で演奏すればいいのかわからない.そしてそのまま,適切ではない指を使って練習を行ってしまうという問題が起こっている.適切ではない指使いを覚えてしまうと,より高度な楽譜を演奏しようとするときに非常に苦労する.そこで運指情報が書かれていない楽譜に機械学習手法を用いて運指の推定を行う.特徴量として直前の音符との音高差,直前の指,推定対象の音符を使用することで9割程度の推定ができることを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
テキストデータからの人にとって有用な情報抽出を行い,その情報の真偽を分析を行いたい.真偽の分析と情報抽出の方法にはデータの独立性に基づいて情報を抽出する独立話題分析を使用することを想定している.しかし独立話題分析による情報抽出と,抽出された情報と真偽の情報との関係性の調査に想定以上に難航し時間がかかっている. また適用するテキストデータにおいて人にとって有用なデータとは何か,また真偽情報が明確に分かり,提案手法の有効性が示すことができるテキストデータの選定にも時間がかかっている.
|
今後の研究の推進方策 |
本年度は,テキスト分析に主眼を置き,その中でもデータの独立性とデータの真偽の関係性について明らかにする. 真偽データが含まれるデータとして,適用するデータには商品レビューデータや新聞データを用いる予定である. またChatGPT等のテキスト生成系AIを用いてテキストデータを作成することも検討中である.
|