2016 Fiscal Year Research-status Report
文字画像データベースを用いたテキスト化に依存しない汎用毛筆画像検索の研究
Project/Area Number |
16K12545
|
Research Institution | National Institute of Japanese Literature |
Principal Investigator |
野本 忠司 国文学研究資料館, 研究部, 准教授 (20321557)
|
Co-Investigator(Kenkyū-buntansha) |
相田 満 国文学研究資料館, 研究部, 准教授 (00249921)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 毛筆画像解析 |
Outline of Annual Research Achievements |
28年度は次のテーマについて研究を実施し,予定通り完了した.1. 千字文データを用いた文字画像マッピング辞書構築: テキスト文字と画像の対応関係を記述した文字画像マッピング辞書の構築.2. 画像エンコーディングの開発; ローカルジェット(Local Jet)による毛筆画像のエンコーディング処理の実装.3.寺沢方式の実装及び,千字文データを使った同方式の評価実験,4. 関連する論文の出版,発表. (1) 野本忠司.ニューラルネットを用いた引用リンクの解消.SIG-IFAT Technical Report, 情報処理学会,2017. (2) Tadashi Nomoto. NEAL: A Neurally Enhanced Approach to Linking Citation to Reference. In Proceedings of Joint Workshop on Bibliometric-enhanced IR and NLP for Digital Libraries (BIRNDL), Joint Conference on Digital Libraries, Newark, NJ, 2016. (3) Tadashi Nomoto. Going Amphibian: A Two-Pronged Approach to Finding What the News is About. Microsoft Research - Korea/Japan Academic Day, Tokyo, 2016
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初予定していたマイルストーンをクリアしたため.
|
Strategy for Future Research Activity |
29年度の計画-- テーマ:機械学習を用いた画像エンコーディングの改良
複数文字からなる検索語のマッピングには特殊な問題が存在する.すなわち,文字それぞれの対応画像のすべての組み合わせが画像検索への入力候補となるため,その数が爆発するという問題である.例えば,検索語が二文字からなり,それぞれの文字に対応する画像が100とすると,画像クエリの数は10,000になる.このため29年度以降は文字画像マッピングの改良を行いこの問題に対応する.具体的には固有空間法やニューラルネットワーク(Auto Encoder, Restricted Boltzmann Machineなど)を用いて複数画像候補を一元化することを考えている.
|
Causes of Carryover |
旅費支出が旅程の短縮により,減ったため.
|
Expenditure Plan for Carryover Budget |
トナーなど消耗品の購入に当てる予定.
|
Research Products
(5 results)