研究課題/領域番号 |
21K17759
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 東京大学 |
研究代表者 |
古田 諒佑 東京大学, 生産技術研究所, 助教 (20843535)
|
研究期間 (年度) |
2021-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2021年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 物体検出 / 半自動着色 / クラスタリング / インペインティング / 話者推定 / ドメイン汎化 / 漫画 / シーン理解 / 画像生成 |
研究開始時の研究の概要 |
本研究では,漫画における詳細なシーン理解を目指し,シーングラフ生成に取り組み,新たな技術を開発する.また,その応用としてシーングラフからのコマ画像の生成や先のコマ画像の予測にも取り組む.グラフを入力としてコマ画像を簡単に生成可能になれば,プロの作家のみならず幅広い方面での創作活動支援に有用である.本研究は漫画を対象として取り組むが,その要素技術は映画やアニメなどの他のコンテンツにも応用可能であると考えているため,あらゆる人々の創作活動支援に役立つことが期待される.
|
研究成果の概要 |
2021年度は漫画におけるシーン理解という包括的な問題を個々の基礎的なタスクに分割して取り組んだ。これらの内容は国内学会では画像の認識・理解シンポジウム(MIRU)のポスター発表と映像表現・芸術科学フォーラムの口頭発表を行い、3件の優秀発表賞を受賞した。また、画像処理分野における査読付き旗艦国際会議ICIPとCG分野における国際会議SIGGRAPH ASIAのポスターに採択され発表を行った。 2022年度はドメイン(作風)に依存しない物体検出器の学習に取り組んだ。本研究の成果は国内で最大規模の査読有りコンピュータビジョンの会議であるMIRU2023にショートオーラル発表として採択された。
|
研究成果の学術的意義や社会的意義 |
本研究の漫画のシーン理解に向けた取り組みにより,これまでよりも詳細かつ高精度なシーン理解が期待される。応用先としては、類似シーンを含む漫画の検索が可能となり、例えば販売サイトにおいてタグやタイトル・作者名による検索以外の新たな検索方法として利用可能である。別の応用先としては漫画の自動翻訳が挙げられ、自動翻訳の精度向上という産業応用に対する貢献だけでなく、高精度な自動翻訳により日本語版と同時に(遅延なく)正規の翻訳版を海外で出版できるようになり、海外における日本の漫画の海賊版普及の抑制という社会的貢献の可能性も秘めている。
|