2015 Fiscal Year Annual Research Report
Renovaton of Character and Scene Text Enginieering
Project/Area Number |
26240024
|
Research Institution | Kyushu University |
Principal Investigator |
内田 誠一 九州大学, システム情報科学研究院, 教授 (70315125)
|
Co-Investigator(Kenkyū-buntansha) |
日比野 治雄 千葉大学, 大学院工学研究科, 教授 (20222242)
柳井 啓司 電気通信大学, 大学院情報理工学研究科, 教授 (20301179)
前田 英作 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, その他部局等, 所長 (90396143)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 文字認識 / パターン認識 / デザイン心理学 / 機械学習 / フォント |
Outline of Annual Research Achievements |
「高精度・汎用文字認識創成」については以下の通りである: H26 年度の大規模文字パターン分布解析やクラス境界解析,特徴記述に関する研究成果を,認識に活用する検討を開始する.この検討を通して従来の精度限界を超えた文字認識手法を開発した.さらに,ビジネス活字・手書き・一般フォントすべてを混在させた「一般文字分布解析」を開始し,それらの各クラスの分布(例えば手書きのA と活字のA)の関係性を定量的に評価した.さらに深層学習の利用を開始し,大規模データを用いた学習により,人間と同程度の認識精度が得られることを実証した. 「環境情報処理」については以下の通りである: H26 年度の文字と環境の相関解析をさらに進めながら,その結果得られた依存関係を実際に用いて,「文字による環境理解」の実験を実施した.具体的には文字の与える言語情報を事前情報(prior)として利用することで,一般物体認識や環境認識を困難にしているセマンティックギャップがどれだけ埋められるかを定量評価する.特に,文字による事前情報がどのような状況で最も有効に機能するかについて詳細に解明した.さらに以上の試みの対偶としての「環境情報による文字理解」の実験を進めた. 「非言語情報処理」については以下の通りである:摂動および最適化に基づくフォント合成を提案した.また,環境中の文字の配色を統計的に解析し,また顕著性についても実証した.デザイン心理学のアプローチにより,フォント形状と注視の関係を吟味した.そして,congealingなる非線形アライメントの手法を実装し,多数のフォントの平均画像を求め,文字Aとは何か?という根本的課題に対する一解明を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
大量のデータを準備しやすい文字認識研究において,深層学習(いわゆるディープラーニング)の著しい有用性が明らかになった.認識における脱ヒューリスティクスを目標の一つとして始めた「文字工学リノベーション」であったが,まさに人間と同程度の認識率を,一切のヒューリスティクスなしに実現できることを実証したことは大きなインパクトとなった.これを受けて研究代表者は,認識率100%が達成できたという仮定の下で,次に実施すべき研究課題を列挙する(Beyond 100%,と称する)など,「リノベーション」の名に相応しい研究展開を図っている.研究分担者においても,それぞれ機械学習とデザイン心理において着実に業績を挙げている.そこではstyle transferなど最新の機械学習技術を文字に適用する試みや,アイトラッカにより特定のフォントのどの部分に注目するかの認知心理学的検証など,新しい試みも成されている.
|
Strategy for Future Research Activity |
本課題は極めて順調に進んでいることを受け,最終年度であるH28年度も大きな指針変更はせずに,現状の試みを進展させる.特に深層学習の利活用については多面的に行うと同時に,どのように深層学習が文字を認識しているかについての内部解析についても並行して行う.本課題終了後に,さらに発展した形態で文字工学研究を実施できるように,来年度からの研究経費(科研費)申請も行う.
|
Research Products
(19 results)