2017 Fiscal Year Research-status Report
決算短信やWEB情報を活用した就職支援のための企業検索システム
Project/Area Number |
15K00315
|
Research Institution | Seikei University |
Principal Investigator |
酒井 浩之 成蹊大学, 理工学部, 准教授 (70402659)
|
Co-Investigator(Kenkyū-buntansha) |
増山 繁 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (60173762)
坂地 泰紀 東京大学, 大学院工学系研究科(工学部), 助教 (70722809)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 就職活動支援 / 企業検索 / テキストマイニング / 自然言語処理 / 業績予測文抽出 / 業績要因抽出 |
Outline of Annual Research Achievements |
本研究は,企業WEBや決算短信から、対象企業の事業に関連する情報を自動的に抽出し、その情報を検索対象とした企業検索システムのための手法の考案を目的とする。本研究成果による企業検索システムでは、学生の研究分野と関連のある企業を容易に検索することができ、学生の就職活動支援に活用できる。これにより、自分の研究分野と関連のある企業を見つけ就職志望とすることで、学生と企業とのミスマッチを防ぐ。 上記の研究目的を達成するために、本年度は決算短信から例えば「営業利益については、減収に伴う差益減に加え、マーケティングコストや人件費の増加により減益を見込んでおります。」のような業績予測文(企業の今後の業績予測を示す文)を抽出する研究を行った。本研究は昨年度の研究の発展であり、昨年度では業績予測に修正のある決算短信のみを対象として業績予測文を抽出していたが、対象の決算短信の範囲を広げ、期初の決算短信からも抽出できるように手法を改良した。 具体的には、昨年度の手法をそのまま期初の決算短信に適用すると、業績予測文と同時に例えば「日本経済については、輸出の持ち直しや原油価格下落の影響等により、景気は緩やかに回復していくことが見込まれます。」のような景気動向の予測を示す文(景気予測文)も抽出されてしまう。そこで、昨年度の手法によって抽出された文が業績予測文であるか景気予測文であるかを深層学習を用いて分類し、さらに、分類された文を再び学習データとすることで、より高い分類精度を達成することができた。 本研究の成果を,企業名を入力するとその企業の決算短信から抽出された業績予測文を検索することができる企業検索システム(研究室WEBサイトで公開済み)に組み込み、より多くの企業の業績予測文が検索できるようになった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成27年度は、(1)企業WEBページ、および、決算短信の収集、(2)決算短信からの業績要因の抽出を行い,上記の課題は予定どおり完了した。さらに、決算短信からの業績要因抽出を発展させ、因果関係(原因と結果)を抽出する研究を行い、その成果を用いて、例えば原因として「猛暑」、結果として「エアコン」を入力すると、原因が「猛暑」で結果が「エアコン」を含む因果関係を記述している決算短信とその企業を検索することができる企業検索システムを開発し、研究室WEBサイトにて公開した。 平成28年度は、決算短信から業績予測文を抽出する研究を行い,その成果を用いて、企業名を入力すると、その企業の決算短信から抽出された業績予測文を検索することができる企業検索システムを開発し、研究室WEBサイトにて公開した。また、企業WEBページからその企業の事業に関連するキーワードの抽出」について取り組み、例えば「個人情報保護基本方針」のような事業に関連のない語が抽出されないようになった。その結果,企業WEBページから抽出されたキーワードを使用して関連企業を検索する関連企業検索の精度が向上した。 平成29年度は、業績予測文抽出手法の改良を行い、期初の決算短信からも業績予測文を抽出できるようになった。さらに、複数の志望企業がある状態から新規の志望企業を探すことを想定し、複数の企業の共通要素を推定し、それを使用して新規の志望企業となる可能性のある関連企業を自動的に推定する手法を開発した。そして、その成果を用いて、入力した複数企業における共通要素から、その共通要素と関連のある企業を検索できるシステムを研究室WEBサイトにて公開した。 以上より、本研究課題は「おおむね順調に進展している」と判断した。
|
Strategy for Future Research Activity |
平成30年度以降は、決算短信から業績要因を抽出する手法を改良し、より多くの業績要因を抽出できるようにすることを目指す。現在の業績要因抽出手法の精度は80%程度と高いものの、再現率は50%程度であり、半分もの業績要因が抽出できていない。そこで、深層学習を用いて決算短信から業績要因を抽出することで、業績要因抽出の精度を落とさず再現率の向上を目指す。ここで、深層学習の学習データとして現手法によって抽出された業績要因をさらに絞り込んで使用することで、学習データの自動生成を行う。 本研究により、研究成果の1つである決算短信の業績要因を用いた企業検索システムの検索企業数の向上が期待できる。
|
Research Products
(14 results)