研究課題/領域番号 |
17K00241
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 公立はこだて未来大学 |
研究代表者 |
寺沢 憲吾 公立はこだて未来大学, システム情報科学部, 准教授 (10435985)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 画像、文章、音声等認識 / パターン認識 / データベース / デジタルアーカイブ |
研究成果の概要 |
本研究では、画像特徴に基づいて特定の文字列の出現頻度や出現パターンを解析することで、機械判読が困難である文書画像に対しても、頻出語の抽出や、抽出された頻出語の重要度の評価を可能にし、さらにはこれを用いて各文書の内容を要約したり、特定のトピックと関連の高い箇所を抽出したりすることで、文書画像デジタルアーカイブの有効活用を促進する手法を開発した。また、明治期の未翻刻の新聞画像を対象に実証実験を行い、開発した手法の性能と有効性を確認した。
|
自由記述の分野 |
画像、文章、音声等認識
|
研究成果の学術的意義や社会的意義 |
本研究の成果により、手書きであったり経年劣化を経ているなどの理由で機械判読が困難である文書画像に対しても、その内容の要約や、特定のトピックと関連の高い箇所を閲覧者に提示することが可能となる。これにより、各地で整備が進み蓄積されている文書画像デジタルアーカイブが、専門研究者のみならず、一般市民や地域史に興味を持つ人々などにとっても、使いやすく便利な文献資料として、その価値を高めていくことが期待される。
|