Project/Area Number |
22K18010
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 62030:Learning support system-related
|
Research Institution | Takushoku University |
Principal Investigator |
西垣 貴央 拓殖大学, 工学部, 助教 (40803523)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2026: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2025: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2024: ¥130,000 (Direct Cost: ¥100,000、Indirect Cost: ¥30,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
|
Keywords | 情報抽出 / データマイニング / テキストマイニング / 独立話題分析 / 情報閲覧システム / インタラクティブ / 学習支援 |
Outline of Research at the Start |
膨大な量のデータがインターネット上に存在しているため人にとって本当に有用なデータなのか,不要なデータなのかの取捨選択は非常に煩雑である.またそのデータが真実のデータなのか,虚偽のデータなのかのチェックも必要になっている.しかし急激に高度情報化社会に突入したことにより,データの真偽や信頼性を適切に評価する方法を,人に教育することができておらず,多くの人は適切にデータの真偽や信頼性を評価できない.そこで本研究では,計算機による信頼性の高い情報の抽出を人と対話的に行うことで,人が抽出された情報の真偽や信頼性の推定ノウハウの学習を支援するシステムの開発を行う.
|
Outline of Annual Research Achievements |
当年度の研究実績として,多くのデータから人にとって有益な情報を抽出する方法の提案及び作成や,機械学習手法における評価関数の違いが結果にどのような影響を与えるのかを実験的に調査を行った.これらはこれまで人が行っていた作業を,機械が人の代わりに人と同等以上の結果を得ることや,これまで検証されていなかった評価関数を用いることでより人にとって有益な結果になりうるかどうかの検証を目的としている.具体的には,①初心者向けピアノ楽譜に記載されていない運指を機械学習手法を用いて推定を行う研究および,②機械学習手法の一つにサポートベクター回帰が存在するが,それに用いられる評価関数には2種類が知られている.しかし実際に使用されているのは1種類のみであるため,もう1種類を用いた結果の差異を実際のデータを用いて検証した. ①については,昨年度提案した運指推定の方法での課題であった指の追い越しへ対応するために,データを時系列とみなして,サポートベクターマシンと動的計画法を組み合わせた方法を提案した.提案した手法を用いることで,これまで正しく推定できていなかった指の追い越しについて大幅な精度向上が見られた. ②については,損失関数として提案されているものは絶対値(L1ノルム)を使用するものと二乗値(L2ノルム)を使用するものの2種類あるが,これまで実際に使用されているのはL1ノルムを使用するものだけであった.そこでL2ノルムを使用するプログラムを作成し実際のデータへ適用してL1ノルムを使用したものとL2ノルムを使用したものとの違いを検証した.結果はデータによって精度の違いを発見することができた.
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
真偽の疑わしいテキストデータへ独立話題分析を使用することで,情報の信頼性を得る方法を提案及び作成したい. そのために独立話題分析の結果と情報の信頼性との関係性を発見する必要があるが,その調査に想定以上の時間がかかっている. また一昨年度より研究環境が変わったことに加え,昨年度は研究活動以外の主に教育活動での時間が思った以上に取られてしまった.
|
Strategy for Future Research Activity |
本年度は,テキストデータに対して独立話題分析を用いることで,得られる人にとって有益な情報について詳細に調べる.具体的にはすでに提案されている独立話題分析とコサイン類似度を用いたクラスタリングでは本当に独立なクラスタ情報を抽出ができていないのではないかと考えている.そこで独立話題分析と他の方法を組み合わせることでより独立な,より人にとって有益な情報を得ることができるのではないかと考えている. より独立な情報を抽出できることによって,情報の根源に近いものを得ることができ,信頼性が高い情報と言えるのではないかと考えている.
|