2010 Fiscal Year Annual Research Report
コーパスを利用した科学技術分野でのシソーラス構築と関連文書抽出への利用
Project/Area Number |
20500127
|
Research Institution | University of Yamanashi |
Principal Investigator |
鈴木 良弥 山梨大学, 大学院・医学工学総合研究部, 准教授 (20206551)
|
Keywords | シソーラス / 類義語 / 関連文書抽出 / 特許公報文 |
Research Abstract |
本研究は特許公報文コーパスを利用した科学技術分野でのシソーラス構築と,構築したシソーラスを利用して関連文書抽出を行うことを目的とする.具体的には日本語特許公報文に焦点をあて,1. 関連単語対の抽出,2. 関連単語対の細分類,3. シソーラスの構築,4. シソーラスを利用した関連文書抽出する.本研究の特色・意義は,1. システムでも利用者でも利用可能なシソーラスの構築手法の提案,2. 他分野でも利用可能なシソーラス構築手法の提案,3. 構築したシソーラスの情報を利用した関連文書抽出の3点に集約できる.シソーラスの構築の研究は数多く行われているが,構築したシソーラスを他の言語処理・情報検索タスクに活用する研究は殆ど無かった.また関連文書抽出に関する研究は多く行われてきたが,シソーラスなどの意味情報の利用を積極的に利用して抽出精度を向上させる研究はほとんど無かった.本研究で構築したシソーラスの情報を特許公報文の関連文書抽出に利用し,抽出精度を向上させることができたことは学術的意義があると考えられる. 上に述べた4つの課題のうち,今年度は4.シソーラスを利用した関連文書抽出を実施した.また本研究は平成22年度が最終年度にあたるため,これまでの成果を論文にまとめている. 本研究では,なるべく汎用的な手法で汎用的な用途に利用出来るシソーラスの作成を目指したが,研究を通して,より効果的にシソーラスを利用するためには利用する用途に応じて作成した汎用的なシソーラスの構造を修正する必要があるという知見を得た.
|