研究実績の概要 |
「高精度・汎用文字認識創成」については,以下の通りである. H26-27年度の大規模データを用いた継続的な検討により,文字認識に対する深層学習(畳み込みニューラルネットワーク)の有効性が明らかになった.これを用いて,ビジネス活字・手書き・一般フォ ントすべてを混在させたユニバーサルOCRの実験を開始し,従来の適用範囲限界を超えた文字認識手法を開発した.さらに情景内文字の検出・認識に関しても,深層学習に基づく手法や,WFST(weighted finite-state transducer)による大規模な言語処理を援用することで,従来限界の打破を行った. 「環境情報処理については以下の通りである,H26-27年度の文字と環境の相関解析をさらに進めながら,その結果得られた依存関係を実際に用いて,「文字による環境理解」の実験を実施した.特に今年度は,情景内文字(テキスト)が与える意味情報を,word2vecのような最新技術を用いて定量化した.さらに様々なレイアウトが施された書籍表紙画像を「環境」と見なし,書籍の内容と表紙画像の関連性を検証するといった,一歩進めた解析も行った. 「非言語情報処理」については以下の通りである.H26-27年度のに実施したフォント合成をさらに進め,フォントと質感(雰囲気)の関係について検討を行った.具体的には上述のword2vecのように単語の意味を定量化できる技術と,文字フォントの形状を定量化する 技術に基づき,それら二つの定量化関係について相関解析に着手した.さらに特定の印象評価をする際にフォントのどの部分に注目するかについて,デザイン心理学的アプローチでの解析を実施した.
|