Project/Area Number |
22H00540
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 61:Human informatics and related fields
|
Research Institution | Kyushu University |
Principal Investigator |
内田 誠一 九州大学, システム情報科学研究院, 教授 (70315125)
|
Co-Investigator(Kenkyū-buntansha) |
北本 朝展 国立情報学研究所, コンテンツ科学研究系, 教授 (00300707)
中山 英樹 東京大学, 大学院情報理工学系研究科, 准教授 (00643305)
牛久 祥孝 オムロンサイニックエックス株式会社, リサーチアドミニストレイティブディビジョン, プリンシパルインベスティゲーター (10784142)
柳井 啓司 電気通信大学, 大学院情報理工学研究科, 教授 (20301179)
大町 真一郎 東北大学, 工学研究科, 教授 (30250856)
塩入 諭 東北大学, 電気通信研究所, 教授 (70226091)
黄瀬 浩一 大阪公立大学, 大学院情報学研究科, 教授 (80224939)
岩村 雅一 大阪公立大学, 大学院情報学研究科, 准教授 (80361129)
山本 和明 国文学研究資料館, 研究部, 教授 (90249433)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥42,380,000 (Direct Cost: ¥32,600,000、Indirect Cost: ¥9,780,000)
Fiscal Year 2024: ¥14,430,000 (Direct Cost: ¥11,100,000、Indirect Cost: ¥3,330,000)
Fiscal Year 2023: ¥13,910,000 (Direct Cost: ¥10,700,000、Indirect Cost: ¥3,210,000)
Fiscal Year 2022: ¥14,040,000 (Direct Cost: ¥10,800,000、Indirect Cost: ¥3,240,000)
|
Keywords | 文字 / コミュニケーション / 生成AI / 機械学習 / デザイン / フォントデザイン / 情景内文字 / 古典籍 / 認知心理 / 自然言語処理 / 教育 / 障碍者支援 |
Outline of Research at the Start |
本課題では,多分野協働体制の下,文字を介したコミュニケーション基盤モデルの創成を目的とする.具体的には,文字を介した視覚的コミュニケーションを7階層に整理した上で,データに基づく情報学的手法群と,認知心理学やデザイン学などの各種専門的知見を組み合わせ,文字情報の生成・受理モデルを構築する.さらに同モデルを応用し,独特な文字コミュニケーションを前提とする領域(古典籍・教育・福祉・ナビゲーション)に貢献する.
|
Outline of Annual Research Achievements |
「文字を介した視覚的コミュニケーション基盤の創成」について初年度同様,極めて多角的な研究を行った.具体的には,文字画像に関する基盤技術として,拡散モデルや敵対的生成ネットワークに代表される生成AI技術を用いた文字画像や文書デザイン生成,特定のスタイルを持った活字や手書きの生成,敵対的攻撃に対して頑健な文字生成,文字スタイル分析,CLIP(対照学習)を用いた文字印象と画像の相関分析,タイポグラフィ支援(文字スタイル推薦,カーニング(文字間隔)自動設定,レイアウトデータセットの構築とそれを用いたレイアウト生成),情景内文字認識および合成,情景内文字隠蔽(選択的隠蔽を含む),情景内文字のクオリティ評価,などが挙げられる.これら多方面に広がる基盤技術は,わが国のみならず世界的にも最新の文字研究動向をカバーもしくは独自推進するレベルであると自負する.応用分野である認知心理学関連については注意機構に関する実験を行っている.古典籍分析については,くずし字データ認識や,くずし字合成,さらにくずし字の活字化などがあり,これらの成果のいくつかについては誰でも扱えるように公開されており,わが国における古典籍理解の推進に大きく寄与している.なお,これら研究のほとんどすべてにおいて,最新の機械学習手法に基づいたモデルを新たに開発している点は特筆に値する.また,世界的な書体デザイナーである小林章氏から,研究に対するフィードバックを得ている点も,研究方針が独善的にならないために重要と考えている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
【研究実績の概要】で述べた通り,また研究成果のリストにも列挙しているように,文字というキーワードを中心に多面的な研究を多数展開している.この多面性こそが,本課題が想定していた「視覚を介した文字コミュニケーションの多レイヤ(意図,言語,文字画像,レイアウト,提示)における理解」を深めていることに他ならない.また,研究代表者のグループでは,文字文書画像関係で世界トップ国際会議であるICDARにおいて,世界最多レベルの6編の論文が採択されている.こうしたエビデンスにより,「おおむね順調に進展」と自己評価する.
|
Strategy for Future Research Activity |
最終年度である2024年度においても,引き続き計画に従って,当研究グループの強みである多面性を活かしつつ,「人間のコミュニケーションにおける文字の役割」の解明に関する研究を深める.また,最終年度独自のイベントとして,多面的な成果を俯瞰しつつ,それらの相互関係を理解するための研究集会を実施する.このイベントにより,さらに次の文字画像研究の方向性を計画する.
|