研究課題/領域番号 |
22K18010
|
研究機関 | 拓殖大学 |
研究代表者 |
西垣 貴央 拓殖大学, 工学部, 助教 (40803523)
|
研究期間 (年度) |
2022-04-01 – 2027-03-31
|
キーワード | 情報抽出 / データマイニング / テキストマイニング / 独立話題分析 |
研究実績の概要 |
当年度の研究実績として,多くのデータから人にとって有益な情報を抽出する方法の提案及び作成や,機械学習手法における評価関数の違いが結果にどのような影響を与えるのかを実験的に調査を行った.これらはこれまで人が行っていた作業を,機械が人の代わりに人と同等以上の結果を得ることや,これまで検証されていなかった評価関数を用いることでより人にとって有益な結果になりうるかどうかの検証を目的としている.具体的には,①初心者向けピアノ楽譜に記載されていない運指を機械学習手法を用いて推定を行う研究および,②機械学習手法の一つにサポートベクター回帰が存在するが,それに用いられる評価関数には2種類が知られている.しかし実際に使用されているのは1種類のみであるため,もう1種類を用いた結果の差異を実際のデータを用いて検証した. ①については,昨年度提案した運指推定の方法での課題であった指の追い越しへ対応するために,データを時系列とみなして,サポートベクターマシンと動的計画法を組み合わせた方法を提案した.提案した手法を用いることで,これまで正しく推定できていなかった指の追い越しについて大幅な精度向上が見られた. ②については,損失関数として提案されているものは絶対値(L1ノルム)を使用するものと二乗値(L2ノルム)を使用するものの2種類あるが,これまで実際に使用されているのはL1ノルムを使用するものだけであった.そこでL2ノルムを使用するプログラムを作成し実際のデータへ適用してL1ノルムを使用したものとL2ノルムを使用したものとの違いを検証した.結果はデータによって精度の違いを発見することができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
真偽の疑わしいテキストデータへ独立話題分析を使用することで,情報の信頼性を得る方法を提案及び作成したい. そのために独立話題分析の結果と情報の信頼性との関係性を発見する必要があるが,その調査に想定以上の時間がかかっている. また一昨年度より研究環境が変わったことに加え,昨年度は研究活動以外の主に教育活動での時間が思った以上に取られてしまった.
|
今後の研究の推進方策 |
本年度は,テキストデータに対して独立話題分析を用いることで,得られる人にとって有益な情報について詳細に調べる.具体的にはすでに提案されている独立話題分析とコサイン類似度を用いたクラスタリングでは本当に独立なクラスタ情報を抽出ができていないのではないかと考えている.そこで独立話題分析と他の方法を組み合わせることでより独立な,より人にとって有益な情報を得ることができるのではないかと考えている. より独立な情報を抽出できることによって,情報の根源に近いものを得ることができ,信頼性が高い情報と言えるのではないかと考えている.
|
次年度使用額が生じた理由 |
研究進捗が想定以上の遅れており,当初の予定では国際会議等で発表を行う予定であったが,投稿ができなかったため,当該年度では国内発表のみとなってしまった.次年度では,次年度使用額を使用し国際会議等で発表を行う.
|