ウェブの普及により、様々なデータが電子化され公開されることにより誰にでもアクセス可能な状況になってきている。そのような流れの一つとして、学術論文に関する情報のデジタルオンライン化が進められている。特に、コンピュータサイエンスの世界では、そのようなデジタル化が精力的に行われ情報が公開されてきており、研究者間や会議間の関係抽出、また研究トピック抽出の研究が国内外を問わず活発に行われている。一方、そのような論文情報のオンラインデータ化や公開アクセスが十分行われていない分野の一つに医学論文が挙げられる。学術情報からの情報抽出、抽出された要素関係の分析は、コンピュータサイエンスの論文文献データにおいて盛んに扱われているが、本研究の対象とする医学論文データはその性質が細分化・専門化されているという点にて大きく異なる。本研究では、このようなデータからの固有表現の抽出とそれらの間の関係抽出の新しい手法の開発、および、抽出された情報を可視化する技術の開発を行った。開発した技術を応用することにより、分野の専門家でなくてもあるトピックにおける関連研究者は誰であるのかを簡単に調査できたり、重要論文を見つけられたりといった学術に関わる調査をサポートすることがより容易になる。
|