2014 Fiscal Year Research-status Report
視覚障害者自らが化学構造式を理解するために必要なソフトウェアの開発に関する研究
Project/Area Number |
25590293
|
Research Institution | Nihon University Junior College |
Principal Investigator |
上條 治夫 日本大学短期大学部, 生命・物質化学科, 講師 (50123170)
|
Co-Investigator(Kenkyū-buntansha) |
廣林 茂樹 富山大学, 大学院理工学研究部(工学), 教授 (40272950)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 入門化学 / ケモインフォマティックス / コンピュータを利用する学習 / 化学構造式認識 / 視覚障害者 / 支援技術 / 化学におけるマイノリティ |
Outline of Annual Research Achievements |
様々な化学情報は化学構造式を含んだ画像として提供されるので、視覚障害者にはアクセスしにくい。また学習の初期における情報取得がきわめて重要であることから、教育現場における化学情報の収得方法の検討が必要である。本研究は化合物名を読み上げることによって視覚障害者が化学構造を認識するためのソフトウェアを開発している。このソフトウェアはパソコンの出力画面やスキャンされた画像から化学構造式を抽出するステップ、抽出された化学構造式から化合物名を検索するステップおよび検索して得られた化合物名と地の文字を読み上げるための3つのステップから構築されている。第1ステップおよび第2ステップについてはそれぞれ既に知られているがそれらを統合したシステムについてはほとんど検討されていなかった。更に第2ステップはケモインフォマティックス法と呼ばれているがその手法はこんぴゅーたのGUIのOSに依存しているので、GUIのOSに依存した手法が利用できない視覚障害者のための新たな手法が必要であった。そこで本研究では、文字情報と同様に、化学構造式を画面音声読み上げソフトで確認する手法を検討し、システム化を行った。本システムでは、まず文章全体を文字と化学構造式領域に分割し、文字領域はMicrosoft社のOCRライブラリに伝達して音声読み上げを行う。化学構造式は、ChemAxon社のmarvinbeansというライブラリに伝達し、その出力として化学構造式名を音声読み上げに渡す。本研究で構築したシステムについて、3名の視覚障碍者に使用感を求めたところ、音声も聞きやすく、触図で確認するより格段に早く化学構造式名にアクセスできることを挙げた。なお、本システムは検討過程ではあるが、希望する視覚障碍者に配布することも検討している
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の申請に当たり、研究目的に対応して内容を以下の3点にまとめた。①視覚障害者による構造式作成、②構造式画像の抽出および抽出結果から化合物名を検索するシステムについて吉のシステムの検討③吉のシステムを統合するための新システムの開発と改良 具体的には①でXyMTeX法を用いて初級の化学教育で必要な化合物の描画を行い、②では①で描画したイメージファイルをケモインフォマティックス法に対応するファイルに変換する手法をいくつかの既存のソフトウェアを用いて比較検討し、③では抽出した画像を横方向密度と面密度の測定を行って、文字部分と化学構造式部分を識別するという新たな構造式抽出システムを開発し、抽出画像をChemAxon社のmarvinbeansというライブラリに伝達し、その出力として化学構造式名を音声読み上げに渡すためのシステムを開発した。これらの結果、試作したシステムを用いれば、文字と化学構造式が混在したイメージファイルを化合物名(IUPAC)を読みながら文字も一括して読み下すことができるようになった。CLiDE社が提供する化学構造式画像および高校教科書中の化学構造式画像を用いて本システムを試行したところ、構造式抽出においては約90%成功し、化合物読み上げにおいては約50%の正解率が得られた。構造式抽出では線密度と綿密土を基準としていることから、複数の環を持つような化合物では、密度の急激な変化が起きていて、正しい抽出結果が得られていない。また化合物読み上げにおいては元素記号の誤読が生じていて、そのために正しい化合物名を与えていない例があった。
|
Strategy for Future Research Activity |
本研究は化学構造と文字が混在する出版物や論文などの印刷物の読み取りが最終目標であるが、そうした資料は文字と化学構造式以外の図表を含んでいて、図表の多くが読みとり結果において「文字化け」を引き起こすことを避けることができないことから、現状はあらかじめ用意した資料を用いてシステムを試作した。本研究で試作したシステムでは、文字と化学構造式を識別するためのプログラムで用いる画像処理のための2値化の閾値を化学構造式と文字が混在することを前提とし、横方向密度と綿密土を用いて設定した。また文字と化学構造式以外に表など、他のアイテムを含んだ資料についての対応も今後の検討が必要である。試作したシステムでは化学構造が横に3つ並んだ画像が解析できていて、2つ以下の場合も解析できていて、それぞれの化合物名を読み上げることができた。また地の文章が日本語と英語に対応できていて、化合物名はIUPACに準拠した英語読みに対応した。しかし、日本語環境での作業を想定した場合、支援テクノロジーとしては化合物名は慣用名の日本語読み上げが望ましいと考えていて、これらについての検討も必要である。本研究で構築したシステムについて、3名の視覚障碍者に使用感を求めたところ、音声も聞きやすく、触図で確認するより格段に早く化学構造式名にアクセスできることを挙げた。なお、本システムは検討過程ではあるが、希望する視覚障碍者に配布することも検討している。現状はあらかじめ用意した資料を用いて化合物名と文字の読み上げを検討していて、初級の化学教科書をはじめ、書籍や論文などを資料とした読みとりについての検討が必須であり、化学構造式の読みとり精度についての検討が必要である。
|
Causes of Carryover |
ソフトウェア開発が本研究の主目的であり、研究に一定の進捗が認められたことから、従来の研究と平行して、報告書の作成を開始した。報告書作成上の必要から、英文校正のための支出が必要だった。また当初予想された打ち合わせのための旅費は、インターネットなどを効率的に利用することで出張が不要となり、そのために費用に残高が生じた。
|
Expenditure Plan for Carryover Budget |
27年度は研究が最終年度を迎えるので、報告書の作成のための経費に充当する予定であり、報告書の作成のための研究分担社との面談の必要から、出張のための費用に充当する予定である。
|
Research Products
(1 results)