Research Abstract |
本研究では,経済新聞記事に含まれる企業業績に関する記事から,その業績要因を自動的に抽出し,さらに,抽出した業績要因に対して当該企業業績に対する重要度を自動的に付与することで,抽出した業績要因を投資判断の支援だけでなく,景気予測,技術動向予測などの用途に使用することのできう情報に変換することを目的とする.今年度は,以下の研究項目を推進し,いくつかの成果を得ることができた. 1.企業の業績発表記事からの業績要因表現抽出手法の改良 本研究では,企業の業績発表記事から業績要因表現を抽出する既提案手法の改良を行った。既提案手法の業績要因表現の抽出手法では,抽出すべき業績要因を「共通頻出表現」と「手がかり表現」の2つの表現で構成される形態素列と定義した.しかしながら,共通頻出表現は,異なった業績要因に対して共通して頻出する形態素列と定義された表現(「売り上げ」等)であり,「靴向け人工皮革も伸び悩んだ。」のように,その企業にとって重要なキーワード(この例では「人工皮革」)を含みつつ,共通頻出表現を含まない業績要因を抽出することができなかった.そこで,ある企業の業績発表記事から業績要因を抽出する際に,その企業のWebサイトから当該企業にとって重要なキーワードを抽出し,それを共通頻出表現として使用することで既提案手法では抽出できなかった業績要因を抽出できるような手法を追加した.この改良によって,既提案手法の再現率は67.1%であるが,改良手法の再現率は73.7%であり,既提案手法では抽出できなかった業績要因が抽出できるようになった。 2.業績要因表現への重要度付与手法の開発 本研究では,企業の業績発表記事から抽出した業績要因表現に対して重要度を付与する手法の開発を行った.例えば,「三菱電機」は多くの事業を行っているが,会社四季報によれば,三菱電機の特色欄に「FAが収益柱」という記述がある.そのため,三菱電機の業績要因としてFA(ファクトリーオートメーション)が好調(もしくは不振)であれば,投資判断を行ううえで重要な情報となる.しかし,個人投資家が必ずしも多くの企業の主力事業を熟知しているわけではない.そこで,既提案手法を改善するために抽出した企業のWebサイトから当該企業にとって重要なキーワードを利用して業績要因に対して重要度を付与し,その重要度に基づいて最も重要な業績要因の自動判定を行った.評価の結果,本手法は77.3%の正解率を達成し,業績発表記事において2番目に出現する文を最重票の業績要因として判定するLead(s2)手法や,業績発表記事において最初に抽出される業績要因を最重要の業績要因としで判定するLead(ce)手法より高い正解率を達成した.
|