• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

機械可読時代における文字科学の創成と応用展開

Research Project

Project/Area Number 17H06100
Research InstitutionKyushu University

Principal Investigator

内田 誠一  九州大学, システム情報科学研究院, 教授 (70315125)

Co-Investigator(Kenkyū-buntansha) 柳井 啓司  電気通信大学, 大学院情報理工学研究科, 教授 (20301179)
牛久 祥孝  東京大学, 大学院情報理工学系研究科, 講師 (10784142)
Project Period (FY) 2017-05-31 – 2022-03-31
Keywords文字科学 / 文字工学 / 文字認識 / 機械学習 / フォント
Outline of Annual Research Achievements

H30年度も文字の4機能の原理解明のための基礎研究を多角的に実施した.
周囲の明確化機能:物体認識における文字情報の有効性を評価するために,170万枚の情景画像を用いて,文字情報と,その文字が書かれている物体間の,共起性解析を行った.その結果,特定の物体クラスにのみ現れる文字情報があるなどの知見を得た.また,画像中の注目すべき領域について言語記述する方法も提案した.
知識・意味伝達機能:情景内に存在する文字の意味分布を調査した.さらに基盤技術として,文字超解像や文字拡大技術を開発し,またフォントの色や形状を含めた単語の意味ベクトル化についても検討を開始した.
雰囲気伝達機能:書籍ジャンルとタイトル文字のフォント形状および文字色の相関関係についてこれまでの結果を取りまとめるとともに,インターネット広告についても同様の分析を行い,広告内容とそこに使われている文字情報の相関関係を調査し,まとめた.また検討を進めていたロゴの自動デザインについてもさらに改良を図り,結果の高精度化を実現するとともに,既存デザインの「差分」を利用した新しいデザイン法も提案した.さらに特定質感を持ったフォント合成技術についても提案した.
可読性維持機能:CNNによる文字認識の挙動解析についてさらに調査を進めた.特にCNNが文字の構造をどのように捉えているかについて多角的な観察を行った.特に,プーリング方向のクラス依存性,重要がその可視化については論文としてまとめた.さらに,可読性・変形耐性を兼ね備えたアルファベット生成過程の解明のために,従来は困難であった「活字集合-手書き集合間の相互変換」ならびに「時系列文字表現と画像文字表現間の相互変換」を実現した.さらに難読文字である花押に関する距離学習,サイン(シグネチャ)の解析,難読文字の最適リジェクトについても検討した.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

今年度は,文字の4 機能(周囲の明確化,知識・意味伝達,雰囲気伝達,可読性維持)の解明について,予定以上に進捗した課題が複数見られるので,上記の評価とした.
研究の推進に当たっては,深層学習をはじめとする最先端の機械学習の技術を積極的に活用している.その結果,例えば従来は困難とされた「活字集合-手書き集合間の相互変換」ならびに「時系列文字表現と画像文字表現間の相互変換」が実現できており,これらは期待以上の成果と考えている.また深層学習以外にも,従来はパターン認識の分野であまり取り入れられることが無かったランキング学習(TopRank学習,TopPush学習)や,Learning with rejection (識別関数と棄却関数の同時最適化)についても,文字機能解明のために積極的に導入し,すでに効果を確認している.
国際会議での論文発表も順調である.牛久ら(研究分担者)のCVPR(計算機科学分野でのトップ会議)や,柳井ら(研究分担者)のNIPS workshop論文,そして内田ら(研究代表者)も最も歴史あるパターン認識関連国際会議であるICPR2018でBest Student Paperを受賞し,また信号処理のトップ会議であるICASSPでの発表が確定している.文字文書解析の世界最大の国際会議であるICDAR2019に対しては,3月に数多くの論文を投稿済みである.

Strategy for Future Research Activity

引き続き,文字の4機能について,網羅的並列的に複数の研究を進捗させる予定である.以下はそれら研究課題の例である.
周囲の明確化機能:2018年度に実施した「文字情報と物体情報の共起性」に関する結果を利用し,物体認識における文字情報の有効性を引き続き評価する.
知識・意味伝達機能:我々の身の回りの文字情報が与える意味情報を詳細に数値化するための手法について引き続き開発を行う.さらに画像情報の言語化についても,
雰囲気伝達機能:フォントやロゴの合成手法について,深層学習やGenerative adversarial networksを利用しつつも,よりデザインの方法論を意識した手法を開発する.
可読性維持機能:文字がなぜ認識できるのかについて,引き続き多角的な検証を行う.特に,Learning with rejectionにより,どのような文字が不可読と判定されるかを検証したり,TopPush学習により,文字らしさの序列を客観的かつ自動的に与える手法を構築する.

  • Research Products

    (70 results)

All 2019 2018 Other

All Int'l Joint Research (3 results) Journal Article (19 results) (of which Int'l Joint Research: 8 results,  Peer Reviewed: 15 results,  Open Access: 1 results) Presentation (46 results) (of which Int'l Joint Research: 9 results,  Invited: 10 results) Book (1 results) Remarks (1 results)

  • [Int'l Joint Research] ドイツ人工知能研究所(DFKI)/カイザースラウテルン工科大学(ドイツ)

    • Country Name
      GERMANY
    • Counterpart Institution
      ドイツ人工知能研究所(DFKI)/カイザースラウテルン工科大学
  • [Int'l Joint Research] Wuhan University of Technology/富士通北京研究所(中国)

    • Country Name
      CHINA
    • Counterpart Institution
      Wuhan University of Technology/富士通北京研究所
  • [Int'l Joint Research] トゥールーズ情報学研究所(フランス)

    • Country Name
      FRANCE
    • Counterpart Institution
      トゥールーズ情報学研究所
  • [Journal Article] A Large-scale Analysis of Regional Tendency of Twitter Photos Using Only Image Features2019

    • Author(s)
      Tetsuya Nagano, Takumi Ege, Wataru Shimoda and Keiji Yanai
    • Journal Title

      Proc. of IEEE International Conference on Multimedia Information Processing and Retrieval

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Label-Noise Robust Generative Adversarial Networks2019

    • Author(s)
      Takuhiro Kaneko, Yoshitaka Ushiku, Tatsuya Harada
    • Journal Title

      Proc. IEEE Conference on Computer Vision and Pattern Recognition

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Comic Text Detection Using Neural Network Approach2018

    • Author(s)
      Rayar Frederic、Uchida Seiichi
    • Journal Title

      Proceedings of 3rd International Workshop on coMics ANalysis, Processing and Understanding (MANPU2019)

      Volume: - Pages: 672~683

    • DOI

      10.1007/978-3-030-05716-9_60

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] An Image-Based Representation for Graph Classification2018

    • Author(s)
      Rayar Frederic、Uchida Seiichi
    • Journal Title

      Proceedings of IAPR Joint International Workshops on Statistical Techniques in Pattern Recognition and Structural and Syntactic Pattern Recognition

      Volume: - Pages: 140~149

    • DOI

      10.1007/978-3-319-97785-0_14

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] On Fast Sample Preselection for Speeding up Convolutional Neural Network Training2018

    • Author(s)
      Rayar Frederic、Uchida Seiichi
    • Journal Title

      Proceedings of IAPR Joint International Workshops on Statistical Techniques in Pattern Recognition and Structural and Syntactic Pattern Recognition

      Volume: - Pages: 65~75

    • DOI

      10.1007/978-3-319-97785-0_7

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] How do Convolutional Neural Networks Learn Design?2018

    • Author(s)
      Jolly Shailza, Iwana Brian Kenji, Kuroki Ryohei, Uchida Seiichi
    • Journal Title

      Proceedings of the 24th International Conference on Pattern Recognition

      Volume: - Pages: -

    • DOI

      10.1109/ICPR.2018.8545624

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Introducing Local Distance-Based Features to Temporal Convolutional Neural Networks2018

    • Author(s)
      Iwana Brian Kenji、Mori Minoru、Kimura Akisato、Uchida Seiichi
    • Journal Title

      Proceedings of 16th International Conference on Frontiers in Handwriting Recognition

      Volume: - Pages: -

    • DOI

      10.1109/ICFHR-2018.2018.00025

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Discovering Class-Wise Trends of Max-Pooling in Subspace2018

    • Author(s)
      Zheng Yuchen, Iwana Brian Kenji, Uchida Seiichi
    • Journal Title

      Proceedings of 16th International Conference on Frontiers in Handwriting Recognition

      Volume: - Pages: -

    • DOI

      10.1109/ICFHR-2018.2018.00026

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] CNN Training with Graph-Based Sample Preselection: Application to Handwritten Character Recognition2018

    • Author(s)
      Rayar Frederic, Goto Masanori, Uchida Seiichi
    • Journal Title

      Proceedings of The 13th IAPR International Workshop on Document Analysis Systems

      Volume: - Pages: -

    • DOI

      10.1109/DAS.2018.10

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Text Line Extraction Based on Integrated K-Shortest Paths Optimization2018

    • Author(s)
      Wang Liuan, Sun Jun, Uchida Seiichi
    • Journal Title

      Proceedings of The 13th IAPR International Workshop on Document Analysis Systems

      Volume: - Pages: -

    • DOI

      10.1109/DAS.2018.68

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Contained Neural Style Transfer for Decorated Logo Generation2018

    • Author(s)
      Atarsaikhan Gantugs, Iwana Brian Kenji, Uchida Seiichi
    • Journal Title

      Proceedings of The 13th IAPR International Workshop on Document Analysis Systems

      Volume: - Pages: -

    • DOI

      10.1109/DAS.2018.78

    • Peer Reviewed
  • [Journal Article] 文字工学から文字科学へ~文字に関する包括的画像情報学研究の展開2018

    • Author(s)
      内田誠一
    • Journal Title

      科研費ニュース

      Volume: 2 Pages: 11-11

    • Open Access
  • [Journal Article] Food category transfer with conditional cycleGAN and a large-scale food image dataset2018

    • Author(s)
      Horita Daichi、Tanno Ryosuke、Shimoda Wataru、Yanai Keiji
    • Journal Title

      Proc. of International Workshop on Multimedia Assisted Dietary Management

      Volume: - Pages: -

    • DOI

      10.1145/3230519.3230597

    • Peer Reviewed
  • [Journal Article] Font Style Transfer Using Neural Style Transfer and Unsupervised Cross-domain Transfer2018

    • Author(s)
      Atsushi Narusawa, Wataru Shimoda, and Keiji Yanai
    • Journal Title

      Proc. of ACCV Workshop on AI Aesthetics in Art and Media

      Volume: - Pages: -

  • [Journal Article] Real-Time Image Classification and Transformation Apps on iOS by "Chainer2MPSNNGraph"2018

    • Author(s)
      Yuki Izumi, Daichi Horita, Ryosuke Tanno and Keiji Yanai
    • Journal Title

      Proc. of NIPS WS on Machine Learning on the Phone and other Consumer Devices

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Continual Learning for an Encoder-Decoder CNN Using "Piggyback"2018

    • Author(s)
      Asato Matsumoto and Keiji Yanai
    • Journal Title

      Proc. of NIPS Continual Learning Workshop, (2018).

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Image-Based Food Calorie Estimation Using Recipe Information2018

    • Author(s)
      EGE Takumi、YANAI Keiji
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E101.D Pages: 1333~1341

    • DOI

      10.1587/transinf.2017MVP0027

    • Peer Reviewed
  • [Journal Article] 視覚・言語融合の最前線2018

    • Author(s)
      牛久祥孝 (著, 編集), 山口正隆 (著), 福井啓 (著), 中山英樹 (著), 齋藤真樹 (著), 吉川友也 (著), 重藤優太郎 (著), 竹内彰一 (著)
    • Journal Title

      映像情報メディア学会誌

      Volume: 72.5 Pages: -

  • [Journal Article] 画像/動画の高精度キャプション生成技術2018

    • Author(s)
      牛久祥孝
    • Journal Title

      光学

      Volume: 47 Pages: -

  • [Presentation] Contrastive-LRPの改良とその多クラス分類可視化応用2019

    • Author(s)
      黒木陵平, 内田誠一
    • Organizer
      電子情報通信学会パターン認識・メディア理解研究会
  • [Presentation] 共有潜在空間を利用した手書き文字のオンライン・オフライン変換2019

    • Author(s)
      角 太智, 早志英朗, 内田誠一
    • Organizer
      電子情報通信学会パターン認識・メディア理解研究会
  • [Presentation] Comic text detection using neural network approac2019

    • Author(s)
      Frederic Rayar and Seiichi Uchida
    • Organizer
      3rd International Workshop on coMics ANalysis, Processing and Understanding (MANPU2019)
    • Int'l Joint Research
  • [Presentation] 深層学習による画像認識・生成と食事画像への応用2019

    • Author(s)
      柳井 啓司
    • Organizer
      電子情報通信学会総合大会 企画セッション
    • Invited
  • [Presentation] 画像変換ネットワークによる連続学習2019

    • Author(s)
      松本 晨人,柳井 啓司
    • Organizer
      データ工学と情報マネジメントに関するフォーラム
  • [Presentation] 変化領域の推測による弱教師あり領域分割の精度向上2019

    • Author(s)
      下田 和, 柳井 啓司
    • Organizer
      電子情報通信学会パターン認識・メディア理解研究会
  • [Presentation] A Large-scale Analysis of Regional Tendency of Twitter Photos Using Only Image Features2019

    • Author(s)
      Tetsuya Nagano, Takumi Ege, Wataru Shimoda and Keiji Yanai
    • Organizer
      IEEE International Conference on Multimedia Information Processing and Retrieval (MIPR)
    • Int'l Joint Research
  • [Presentation] 書籍タイトルフォントのデザイン解析2018

    • Author(s)
      唐松拓郎, 川口維文, 品原悠杜, 内田誠一
    • Organizer
      人文科学とコンピュータシンポジウム
  • [Presentation] 花押類似検索のための畳み込みオートエンコーダによる画像特徴抽出2018

    • Author(s)
      鬼塚洋輔, 大山航, 山田太造, 井上聡, 内田誠一
    • Organizer
      人文科学とコンピュータシンポジウム
  • [Presentation] パターン認識技術でデザインを解析する --書籍タイトルデザインに潜む傾向を探る--2018

    • Author(s)
      唐松 拓郎, 品原悠杜, 川口 維文, 内田 誠一
    • Organizer
      画像の認識・理解シンポジウム
  • [Presentation] 言語を介した画像特徴量の生成とその性質2018

    • Author(s)
      生駒 真也, 川口 維文, 品原 悠杜, 早志 英朗, 内田 誠一
    • Organizer
      画像の認識・理解シンポジウム
  • [Presentation] 文字境界予測に有効なコンテキストの検証2018

    • Author(s)
      安部 健太郎, 黒木 陵平, 早志 英朗, 内田 誠一
    • Organizer
      画像の認識・理解シンポジウム
  • [Presentation] 文字を含む情景画像の異種CNN融合による超解像2018

    • Author(s)
      中尾 亮, 内田誠一
    • Organizer
      電子情報通信学会パターン認識・メディア理解研究会
  • [Presentation] 情景内文字のCNNによる拡大2018

    • Author(s)
      中村俊貴, 内田誠一
    • Organizer
      電子情報通信学会パターン認識・メディア理解研究会
  • [Presentation] 手書き文字と活字の境界を探る2018

    • Author(s)
      森みづき, 中村俊貴, 早志英朗, 内田誠一
    • Organizer
      電子情報通信学会パターン認識・メディア理解研究会
  • [Presentation] 情景内の文字情報と画像キャプションの類似性解析2018

    • Author(s)
      竹下孔喜, 生駒真也, 早志英朗, 内田誠一
    • Organizer
      電気・情報関係学会九州支部連合大会
  • [Presentation] 画像に基づく言語翻訳2018

    • Author(s)
      馬場康平, Iwana Brian, 内田誠一
    • Organizer
      電気・情報関係学会九州支部連合大会
  • [Presentation] 畳み込みオートエンコーダによる花押画像解析2018

    • Author(s)
      鬼塚洋輔, 大山 航, 山田太造, 井上 聡, 内田誠一
    • Organizer
      電気・情報関係学会九州支部連合大会
  • [Presentation] CNN層による異常検出2018

    • Author(s)
      ジ ショウトン, Yuchen Zheng, 早志英朗, 内田誠一
    • Organizer
      電気・情報関係学会九州支部連合大会
  • [Presentation] 低解像度画像からの情景内文字検出手法2018

    • Author(s)
      塩山惇太郎, 内田誠一
    • Organizer
      電気・情報関係学会九州支部連合大会
  • [Presentation] 機械可読時代における文字科学の創成と応用展開2018

    • Author(s)
      内田誠一
    • Organizer
      情報系Winterfesta episode4
    • Invited
  • [Presentation] 画像情報学とAI2018

    • Author(s)
      内田 誠一,柳井 啓司
    • Organizer
      第14回 九州大学学術研究都市 情報交流セミナー
    • Invited
  • [Presentation] Machine learning for document analysis and understanding2018

    • Author(s)
      Seiichi Uchida
    • Organizer
      IAPR TC10/TC11 Summer School on Document Analysis: Traditional Approaches and New Trends
    • Int'l Joint Research / Invited
  • [Presentation] An Image-Based Representation for Graph Classification2018

    • Author(s)
      Frederic Rayar and Seiichi Uchida
    • Organizer
      IAPR Joint International Workshops on Statistical Techniques in Pattern Recognition and Structural and Syntactic Pattern Recognition (S+SSPR2018)
    • Int'l Joint Research
  • [Presentation] On Fast Sample Preselection for Speeding up Convolutional Neural Network Training2018

    • Author(s)
      Frederic Rayar and Seiichi Uchida
    • Organizer
      IAPR Joint International Workshops on Statistical Techniques in Pattern Recognition and Structural and Syntactic Pattern Recognition (S+SSPR2018
    • Int'l Joint Research
  • [Presentation] How do Convolutional Neural Networks Learn Design?2018

    • Author(s)
      Shailza Jolly, Brian Kenji Iwana, Ryohei Kuroki, Seiichi Uchida
    • Organizer
      the 24th International Conference on Pattern Recognition (ICPR2018)
  • [Presentation] Introducing Local Distance-based Features to Temporal Convolutional Neural Networks2018

    • Author(s)
      Brian Kenji Iwana, Minoru Mori, Akisato Kimura and Seiichi Uchida
    • Organizer
      16th International Conference on Frontiers in Handwriting Recognition (ICFHR2018)
  • [Presentation] Discovering Class-wise Trends of Max-pooling in Subspace2018

    • Author(s)
      Yuchen Zheng, Brian Kenji Iwana and Seiichi Uchida
    • Organizer
      16th International Conference on Frontiers in Handwriting Recognition (ICFHR2018)
  • [Presentation] CNN Training with Graph-Based Sample Preselection: Application to Handwritten Character Recognition2018

    • Author(s)
      Frederic Rayar, Masanori Goto and Seiichi Uchida
    • Organizer
      The 13th IAPR International Workshop on Document Analysis Systems (DAS2018)
  • [Presentation] Text Line Extraction based on Integrated K-shortest Paths Optimization2018

    • Author(s)
      Liuan Wang, Jun Sun and Seiichi Uchida
    • Organizer
      The 13th IAPR International Workshop on Document Analysis Systems (DAS2018)
  • [Presentation] Contained Neural Style Transfer for Decorated Logo Generation2018

    • Author(s)
      Gantugs Atarsaikhan, Brian Kenji Iwana and Seiichi Uchida
    • Organizer
      The 13th IAPR International Workshop on Document Analysis Systems (DAS2018)
  • [Presentation] 食事画像への深層学習の応用2018

    • Author(s)
      柳井 啓司
    • Organizer
      大阪電気通信大学 学術講演会
    • Invited
  • [Presentation] 深層学習による質感文字生成2018

    • Author(s)
      成沢 淳史, 下田 和, 柳井 啓司
    • Organizer
      人工知能学会全国大会
  • [Presentation] 画像内容を考慮した質感表現に基づく画像変換2018

    • Author(s)
      杉山 優, 柳井 啓司
    • Organizer
      人工知能学会全国大会
  • [Presentation] 教師情報に含まれるノイズに堅牢な弱教師あり領域分割手法2018

    • Author(s)
      下田 和, 柳井 啓司
    • Organizer
      画像の認識・理解シンポジウム
  • [Presentation] 単語情報を利用した画像の質感転送2018

    • Author(s)
      杉山 優, 柳井 啓司
    • Organizer
      画像の認識・理解シンポジウム
  • [Presentation] CNNを用いた質感文字生成2018

    • Author(s)
      成沢淳史, 下田和, 柳井啓司
    • Organizer
      画像の認識・理解シンポジウム
  • [Presentation] Food Category Transfer with Conditional Cycle GAN and a Large-scale Food Image Dataset2018

    • Author(s)
      Daichi Horita, Ryosuke Tanno, Wataru Shimoda, Keiji Yanai
    • Organizer
      International Workshop on Multimedia Assisted Dietary Management (MADIMA)
    • Int'l Joint Research
  • [Presentation] Font Style Transfer Using Neural Style Transfer and Unsupervised Cross-domain Transfer2018

    • Author(s)
      Atsushi Narusawa, Wataru Shimoda, and Keiji Yanai
    • Organizer
      ACCV Workshop on AI Aesthetics in Art and Media (AIMA)
    • Int'l Joint Research
  • [Presentation] Real-Time Image Classification and Transformation Apps on iOS by "Chainer2MPSNNGraph"2018

    • Author(s)
      Yuki Izumi, Daichi Horita, Ryosuke Tanno and Keiji Yanai
    • Organizer
      NIPS WS on Machine Learning on the Phone and other Consumer Devices (MLPCD)
    • Int'l Joint Research
  • [Presentation] Continual Learning for an Encoder-Decoder CNN Using "Piggyback"2018

    • Author(s)
      Asato Matsumoto and Keiji Yanai
    • Organizer
      NIPS Continual Learning Workshop
    • Int'l Joint Research
  • [Presentation] Deep Learningによる視覚・言語融合の最前線2018

    • Author(s)
      牛久祥孝
    • Organizer
      精密工学会 画像応用技術専門委員会
    • Invited
  • [Presentation] Deep Learningによる視覚・言語融合の最前線2018

    • Author(s)
      牛久祥孝
    • Organizer
      NLP若手の会 (YANS) 第13回シンポジウム
    • Invited
  • [Presentation] 視覚と対話の融合研究2018

    • Author(s)
      牛久祥孝
    • Organizer
      人工知能学会 言語・音声理解と対話処理研究会(SIG-SLUD)
    • Invited
  • [Presentation] 機械学習による生成技術とその応用展開2018

    • Author(s)
      牛久祥孝
    • Organizer
      ISID エンジニアリングフォーラム 2018
    • Invited
  • [Presentation] 機械学習による生成技術とその応用展開2018

    • Author(s)
      牛久祥孝
    • Organizer
      ITOC機械学習セミナーシリーズ
    • Invited
  • [Book] コンピュータビジョン2018

    • Author(s)
      米谷 竜、斎藤 英雄、池畑 諭、牛久 祥孝、内山 英昭、内海 ゆづ子、小野 峻佑、片岡 裕雄、金崎 朝子、川西 康友、齋藤 真樹、櫻田 健、高橋 康輔、松井 勇佑
    • Total Pages
      272
    • Publisher
      共立出版
    • ISBN
      978-4-320-12357-1
  • [Remarks] ヒューマンインタフェース研究室ホームページ

    • URL

      human.ait.kyushu-u.ac.jp

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi