2016 Fiscal Year Annual Research Report
Renovaton of Character and Scene Text Enginieering
Project/Area Number |
26240024
|
Research Institution | Kyushu University |
Principal Investigator |
内田 誠一 九州大学, システム情報科学研究院, 教授 (70315125)
|
Co-Investigator(Kenkyū-buntansha) |
日比野 治雄 千葉大学, 大学院工学研究科, 教授 (20222242)
柳井 啓司 電気通信大学, 大学院情報理工学研究科, 教授 (20301179)
前田 英作 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, その他部局等, 所長 (90396143)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 文字認 / パターン認識 / デザイン心理学 / 機械学習 / フォント |
Outline of Annual Research Achievements |
「高精度・汎用文字認識創成」については,以下の通りである. H26-27年度の大規模データを用いた継続的な検討により,文字認識に対する深層学習(畳み込みニューラルネットワーク)の有効性が明らかになった.これを用いて,ビジネス活字・手書き・一般フォ ントすべてを混在させたユニバーサルOCRの実験を開始し,従来の適用範囲限界を超えた文字認識手法を開発した.さらに情景内文字の検出・認識に関しても,深層学習に基づく手法や,WFST(weighted finite-state transducer)による大規模な言語処理を援用することで,従来限界の打破を行った. 「環境情報処理については以下の通りである,H26-27年度の文字と環境の相関解析をさらに進めながら,その結果得られた依存関係を実際に用いて,「文字による環境理解」の実験を実施した.特に今年度は,情景内文字(テキスト)が与える意味情報を,word2vecのような最新技術を用いて定量化した.さらに様々なレイアウトが施された書籍表紙画像を「環境」と見なし,書籍の内容と表紙画像の関連性を検証するといった,一歩進めた解析も行った. 「非言語情報処理」については以下の通りである.H26-27年度のに実施したフォント合成をさらに進め,フォントと質感(雰囲気)の関係について検討を行った.具体的には上述のword2vecのように単語の意味を定量化できる技術と,文字フォントの形状を定量化する 技術に基づき,それら二つの定量化関係について相関解析に着手した.さらに特定の印象評価をする際にフォントのどの部分に注目するかについて,デザイン心理学的アプローチでの解析を実施した.
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Research Products
(21 results)
-
[Journal Article] Scene Text Eraser2017
Author(s)
Toshiki Nakamura, Anna Zhu, Keiji Yanai ,and Seiichi Uchida
-
Journal Title
Proceedings of The 14th International Conference on Document Analysis and Recognition
Volume: 1
Pages: ---
Peer Reviewed / Int'l Joint Research / Acknowledgement Compliant
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-