研究課題/領域番号 |
22K18010
|
研究機関 | 拓殖大学 |
研究代表者 |
西垣 貴央 拓殖大学, 工学部, 助教 (40803523)
|
研究期間 (年度) |
2022-04-01 – 2027-03-31
|
キーワード | 情報抽出 / データマイニング / テキストマイニング / 独立話題分析 |
研究実績の概要 |
初年度の研究実績としては,多くの情報の中から有用な情報を抽出する方法として,まずは複数の分野において,膨大な量のデータから人にとって有用な情報を抽出する方法の提案および作成を行った.これは現在人が行っている作業を,機械が人の代わりに人と同等の結果を得ることを目的としている. 具体的には,①商船に搭載された航海機器や無線機器の異常予兆検知を行う研究および,②ピアノ演奏者の運指を機械学習手法を用いて推定する研究について行った. ①については,商船には多くの航海機器や無線機器が搭載されており,機器が航海の途中で故障すると非常に困る.そのため航海機器や無線機器が壊れる前に壊れる予兆(異常予兆)を検出することが求められている.そこでそれらの機器に異常予兆があらわれているかどうかを機械学習手法を用いて検討を行った.機械学習手法としてMT法とOne-Class SVM(OCSVM)を用いて異常予兆が検知できるかを行い,それぞれの結果の比較を行った.両手法とも外れ値に関しては異常予兆として検出が可能であった.またOCSVMに関しては外れ値の前後のデータにおいても異常予兆を検知しており,外れ値が機器の故障である場合,外れ値前後も検出できるOCSVMのほうが実用的であるという結果となった. ②については,ピアノ演奏初心者は正しい指使いができておらず,運指が記載されていない楽譜を見てもどの指で演奏すればいいのかわからない.そしてそのまま,適切ではない指を使って練習を行ってしまうという問題が起こっている.適切ではない指使いを覚えてしまうと,より高度な楽譜を演奏しようとするときに非常に苦労する.そこで運指情報が書かれていない楽譜に機械学習手法を用いて運指の推定を行う.特徴量として直前の音符との音高差,直前の指,推定対象の音符を使用することで9割程度の推定ができることを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
テキストデータからの人にとって有用な情報抽出を行い,その情報の真偽を分析を行いたい.真偽の分析と情報抽出の方法にはデータの独立性に基づいて情報を抽出する独立話題分析を使用することを想定している.しかし独立話題分析による情報抽出と,抽出された情報と真偽の情報との関係性の調査に想定以上に難航し時間がかかっている. また適用するテキストデータにおいて人にとって有用なデータとは何か,また真偽情報が明確に分かり,提案手法の有効性が示すことができるテキストデータの選定にも時間がかかっている.
|
今後の研究の推進方策 |
本年度は,テキスト分析に主眼を置き,その中でもデータの独立性とデータの真偽の関係性について明らかにする. 真偽データが含まれるデータとして,適用するデータには商品レビューデータや新聞データを用いる予定である. またChatGPT等のテキスト生成系AIを用いてテキストデータを作成することも検討中である.
|
次年度使用額が生じた理由 |
研究環境整備のため計算用サーバとその周辺機器代として計上していたが,計算用サーバは円安のため価格が高騰したため,予算申請時よりスペックを落として購入した.また周辺機器や記憶媒体については,研究代表者自身のものを用いて,購入を見送ったものがいくつかあるため. 使用計画としては,データの保存のために大容量のUSBメモリもしくはSSDの購入に使用する予定である.
|