研究課題/領域番号 |
23700119
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
メディア情報学・データベース
|
研究機関 | 岡山大学 |
研究代表者 |
太田 学 岡山大学, 自然科学研究科, 教授 (10326019)
|
研究期間 (年度) |
2011 – 2012
|
研究課題ステータス |
完了 (2013年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2012年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2011年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 電子図書館 / 文書画像 / ウェブ / 情報抽出 / CRF / 電子書籍 / 閲覧支援 / 論文推薦 / メタデータ / 機関リポジトリ / 文書閲覧支援 |
研究概要 |
学術論文を蓄積する電子図書館では、論文中の書誌情報などを自動抽出する技術が求められる。本研究では、論文タイトルページの文書画像をOCRで解析して得られる各テキスト行や、参考文献文字列をトークン列に変換して得られる各トークンが、いずれの書誌要素に該当するか、条件付確率場(CRF)により推定して抽出する方法を提案した。また論文から抽出した専門用語を利用した関連論文推薦サービスを提案し、電子書籍閲覧端末による学術論文閲覧支援方法を検討した。
|