研究課題/領域番号 |
23K21726
|
補助金の研究課題番号 |
21H03555 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 名古屋大学 |
研究代表者 |
駒水 孝裕 名古屋大学, 数理・データ科学教育研究センター, 准教授 (30756367)
|
研究分担者 |
井手 一郎 名古屋大学, 情報学研究科, 教授 (10332157)
石川 佳治 名古屋大学, 情報学研究科, 教授 (80263440)
波多野 賢治 同志社大学, 文化情報学部, 教授 (80314532)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2024年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2023年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2022年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2021年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
|
キーワード | データ統合 / マルチメディア / 探索的情報検索 / Linked Open Data / テキスト / 異種データ / テキスト分類 / 画像キャプショニング / グラフデータベース / 不均衡データ / データ分類 / 異種データ統合 / データ循環 |
研究開始時の研究の概要 |
昨年度までに,異種データの統合に関する基礎技術(特に,データにラベルを付与する分類問題における不均衡性の問題や大量のデータから必要な情報を効果的かつ効率的に検索する手法)を構築してきた.依然として課題はあるため,これらを更に改善することが今年度の研究内容の一つである. 一方で,これらの成果を受け,さらなる発展として,特に異種モーダルにおいてデータの統合するための基礎技術から応用技術に向けて研究を進行する.
|
研究実績の概要 |
本研究は,様々な種類のデータが公開されており,テキスト,画像,動画などのコンテンツが Web 上に散在している現状に対して,データの統合管理を実現することが大きな目標である.この目標に対して,データ統合と横断的な検索を実現することが目的である. 本年度は,データ統合技術に関連して,(!) 意図の読みにくいテキストを効果的に分類し,テキストを効果的に扱う研究,(2) 画像からその内容をデータ化する画像キャプショニングに関する研究を行った.また,異種データの横断的な検索については,最終的に LOD と同系統のグラフデータベースでデータを構成することを見据え,(3) グラフデータベースにおける効率的な問合せに関する研究を行った. 具体的には,(1) テキスト分類において,分類の手がかりとなる情報を分類モデルに取り込む方法として,マルチタスク学習の方法論を活用した手法を提案した.この研究は,多クラス分類問題において,クラスごとのインスタンスの出現頻度が大きくばらつく不均衡なデータにおいて特に,最新研究よりも良い性能をしめした.(2) 画像データの内容を自動的に生成する画像キャプショニングにおいて,キャプションの内容が学習データに依存しすぎてしまう問題に対して,キャプションの内容を被写体に応じて調整する枠組みに関する研究を行った.これにより,画像に含まれる情報を様々な粒度で取得可能となり,様々な分析などに応用可能となる.また,画像単体では文脈を持たないキャプションが作成できるが,他の関連する画像と合わせてキャプショニングすることで,共通点などの文脈から画像集合に対するキャプショニング手法を構築した.(3) グラフデータベースにおいて,経路に基づく検索は多く用いられおり,効率的な検索システムがもとめられている.これに対し,適切な索引を構築することで効率的な検索を実現する研究を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の果てに構築しようとする研究分野である Linked Open Multimedia Data Management (LOMDM) に対して,テキスト,画像を対象としてその統合を実現する方法の一端を構築できている.加えて,統合したデータを活用するデータベース技術や画像とテキストを同時に扱うマルチモーダルな研究についても研究を進められており,LOMDM の実現に向けた研究が実施できている.
|
今後の研究の推進方策 |
今後の研究の推進方策は,(1) これまでに得られた知見を更にブラッシュアップし,高精度化すること,(2) テキストと画像以外のデータ(動画など)を効果的・効率的に統合・活用する方法論に関する研究,(3) アプリケーション固有の問題を取り入れたデータ統合技術の開発,などに取り組む予定である.
|