研究課題/領域番号 |
16540364
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
原子・分子・量子エレクトロニクス・プラズマ
|
研究機関 | 独立行政法人日本原子力研究開発機構 |
研究代表者 |
佐々木 明 独立行政法人日本原子力研究開発機構, 量子ビーム応用研究部門, 研究副主幹 (10215709)
|
研究分担者 |
加藤 隆子 大学共同利用機関法人, 自然科学研究機構・核融合科学研究所, 教授 (20115546)
城 和貴 国立大学法人, 奈良女子大学・理学部, 教授 (90283928)
PICHL Lukas 国際基督教大学, 理学部, 助教授 (10343394)
大石 雅俊 大学共同利用機関法人, 自然科学研究機構・国立天文台, 助教授 (00183757)
村田 真樹 情報通信研究機構, 情報通信研究部門, 主任研究員 (50358884)
|
研究期間 (年度) |
2004 – 2005
|
キーワード | 原子分子データベース / 原子構造 / 原子分子素過程 / 電子衝突断面積 / 情報検索 / 自然言語処理 / データ抽出 / 機械学習 |
研究概要 |
本研究は、原子分子物理学の専門知識とコンピュータによる言語処理、情報検索の知識を結びつけ、原子分子データベースを画期的に改善する新しい手法を見出すことを目標として行った。従来人手によって行われていたデータベース構築の作業のうち、原子分子データが記述されている論文を発見、収集する過程の自動化の可能性に注目して、原子分子物理学の専門知識のモデル化や要素技術の開発を行った。 本研究では、インターネットを介して論文抄録の情報を収集するシステムの研究を行った。はじめに、学術論文を用語の出現頻度を用いてモデル化し、予め原子分子データが記述されていることが分かっている論文の集合(Y.Itikawa, ADANDT,63,315(1996).)を学習データとするLVQ(Learning Vector Quantization)法による機械学習を用い、与えられた論文に対して原子分子データが記載されているかどうかを判定するプログラムを試作した。判定の正答率、適合率や再現性を向上させるために、次に、原子分子物理学の知識の論文中での表現ついて検討した。原子、イオン、電子配置、スペクトル項、原子核、分子の状態の情報が、電子化された論文中決まった規則で記述されることに注目し、それらの記述を高い精度で抽出できるようにした。加えて、雑誌が論文に対して与える分野コードのような詳細な書誌情報、専門用語の情報などを利用することで、原子分子データが記述されている論文の90%を自動的に収集できることを示した。そして、本研究の結果が、研究者による論文内容の理解の支援や、研究のニーズやシーズの調査などへの応用可能性を持つことを示した。今後より進んだ検索、処理技術を取り入れて、論文中の情報の統計的、定量的な分析を行うことができれば、実際の原子分子データベース構築の自動化に向けた実用化の可能性があると考えられる。
|