1997 Fiscal Year Annual Research Report
Project/Area Number |
07458076
|
Research Institution | National Center for Science Information Systems |
Principal Investigator |
高須 淳宏 学術情報センター, 研究開発部, 助教授 (90216648)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 真一 学術情報センター, 研究開発部, 助手 (90249938)
相澤 彰子 学術情報センター, 研究開発部, 助教授 (90222447)
|
Keywords | 確率文法 / 文書画像理解 / 電子図書館 / 書誌照合 |
Research Abstract |
本研究は、今後大きな需要が予想される画像を中心とした学術情報データベースの構築法の研究を目的としている。この研究では、画像データベースの構築、管理、利用の各課題についての個別的な研究を進めるとともに、これらの要素技術を統合しシステムにまとめ上げる統合化技術についての研究を進めた。最終年度の今年度は、これまで研究を行ってきた画像データの解析、蓄積、ハイパーテキストの自動構成に関する技術をまとめてシステム化するとともに、文書画像解析法として、新たに確率文法に基づいたロバストな解析手法について研究をすすめた。確率文法を用いた解析では、解析過程で用いられる各種の認識器の誤り特性をconfusion probabilityで表すとともに、オブジェクトの構文的構造を解析する過程をtransition probabilityで表すことによって、エラーを考慮しつつ、確率的に最も可能性の高い構造を抽出することができる。本研究では、確率文法による解析と分類アルゴリズムを組合わせることによって汎用性の高い文書画像解析手法を考案した。また、この手法を2つの問題に応用した。第一番目の応用は、雑誌の中から個々の記事を自動的に抽出するもので、電子図書館において、記事データを構築することに利用可能である。第二番目の応用は、参考文献のデータの解析であり、昨年度行った研究と併用することによって、ハイパーテキストの構築精度を高めることに用いることができる。
|
Research Products
(2 results)
-
[Publications] Atsuhiro Takasu: "Bibliographic Integration in Digital Document Libraries" Proc.of ACM DL'97. 264-265 (1997)
-
[Publications] Atsuhiro Takasu: "An Approximate String Match for Garbled Text with Various Accuracy" Proc.of 4th ICDAR. 957-961 (1997)