Research Abstract |
本研究では,経済新聞記事に含まれる企業業績に関する記事から,その業績要因を自動的に抽出し,さらに,抽出した業績要因に対して当該企業業績に対する重要度を自動的に付与することで,抽出した業績要因を投資判断の支援だけでなく,景気予測,技術動向予測などの用途に使用することのできる情報に変換することを目的とする.今年度は,以下の研究項目を推進し,いくつかの成果を得ることができた. 1.製品・部門情報の企業業績要因表現からの抽出手法の開発 本研究では,企業業績発表記事から抽出した業績要因文に含まれる製品や部門情報の抽出を行う手法を開発した.抽出された製品・部門情報は,業績要因文に重要度を付与するための情報として使用する.具体的には,業績要因文を対象とした調査の結果得られた規則性を用いてパタンを作成する.そして,作成されたパタンを適用するために,抽出対象を含む業績要因文を単語に分割し,取得した形態素列に対してパタンを適用して製品や部門情報の抽出を行った.評価の結果,精度55.3%,再現率54.6%であった. 2.製品特徴情報の製品発表プレスリリースからの抽出手法の開発 本研究では,製品発表プレスリリースから「高画質を実現しました。」といった,製品特徴の情報を含む文を抽出する手法を開発した.製品発表に関するプレスリリースに含まれる,その製品の特徴に関する情報は,製品のトレンド分析や企業の開発方針の決定等において重要な情報となり,また,技術動向予測や投資判断支援のための情報としても有用である、抽出には「実現しました。」といった手がかり表現を使用するが,本研究では数多くの手がかり表現を製品発表プレスリリースから自動的に獲得した.また,手がかり表現を自動的に獲得する際に同時に獲得される共通頻出表現(「操作性」など)を使用することで,製品発表プレスリリースでは頻出する体言止めで表される製品特徴文の抽出も可能とした.手がかり表現を自動的に獲得する際に,「発売します。」といった不適切な手がかり表現が獲得されることを防ぐために,不適切な手がかり表現をも自動的に獲得することで,不適切な手がかり表現のリストを作成し,それらが手がかり表現として獲得されることを防ぐことができた.評価の結果,精度78.4%,再現率62.9%であり,不適切な手がかり表現の除去を行わない手法に比べて精度が向上した.
|