2016 Fiscal Year Research-status Report
決算短信やWEB情報を活用した就職支援のための企業検索システム
Project/Area Number |
15K00315
|
Research Institution | Seikei University |
Principal Investigator |
酒井 浩之 成蹊大学, 理工学部, 准教授 (70402659)
|
Co-Investigator(Kenkyū-buntansha) |
増山 繁 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (60173762)
坂地 泰紀 成蹊大学, 理工学部, 助教 (70722809)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 就職活動支援 / 企業検索 / テキストマイニング / 自然言語処理 / 業績予測文抽出 / 業績要因抽出 |
Outline of Annual Research Achievements |
本研究は,企業WEBや決算短信から、対象企業の事業に関連する情報を自動的に抽出し、その情報を検索対象とした企業検索システムのための手法の考案を目的とする。本研究成果による企業検索システムでは、学生の研究分野と関連のある企業を容易に検索することができ、学生の就職活動支援に活用できる。これにより、自分の研究分野と関連のある企業を見つけ、就職志望とすることで、学生と企業とのミスマッチを防ぐ。加えて、中小企業にとっては就職情報サイトへの掲載料が高額なので登録できないのが実情であるが、本研究成果により、中小企業への就職希望学生が増加することが期待できる。 上記の研究目的を達成するために、本年度は、決算短信PDFから例えば「音楽分野は音楽制作が好調であることなどにより,分野全体の売上高は 10月時点の想定を上回る見込みです」のような業績予測文(企業の今後の業績予測を示す文)を抽出する研究を行った。その成果を用いて、企業名を入力すると,その企業の決算短信PDFから抽出された業績予測文を検索することができる企業検索システムを開発し,研究室WEBサイトにて公開した.それにより,業績が期初の予想よりも好調である企業,不振である企業を,その要因も含めて調べることができ,就職活動における企業選択において重要な要素である,業績が好調で成長している企業を調べるための情報源となることが期待できる. また,「企業WEBページからその企業の事業に関連するキーワードの抽出」について取り組み,問題となっていた「個人情報保護基本方針」のような事業に関連のない語が抽出されないようになった.その結果,企業WEBページから抽出されたキーワードを使用して対象企業と関連のある企業を抽出する関連企業抽出の精度が向上した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成27年度は、(1)企業WEBページ、および、決算短信PDFの収集、(2)決算短信PDFからの業績要因の抽出を行い,上記の課題は予定どおり完了した。さらに、決算短信PDFからの業績要因抽出を発展させ、因果関係(原因と結果)を抽出する研究を行い、その成果を用いて、例えば原因として「猛暑」、結果として「エアコン」を入力すると,原因が「猛暑」で結果が「エアコン」を含む因果関係を情報として記述している決算短信PDFとその企業を検索することができる企業検索システムを開発し,研究室WEBサイトにて公開した. 平成28年度は,決算短信PDFから業績予測文を抽出する研究を行い,その成果を用いて、企業名を入力すると,その企業の決算短信PDFから抽出された業績予測文を検索することができる企業検索システムを開発し,研究室WEBサイトにて公開した.また,「企業WEBページからその企業の事業に関連するキーワードの抽出」について取り組み,問題となっていた「個人情報保護基本方針」のような事業に関連のない語が抽出されないようになった. そのため、本研究課題は「おおむね順調に進展している」と判断した。
|
Strategy for Future Research Activity |
平成29年度以降は、複数の志望企業がある状態から新規の志望企業を探すことを想定し,複数の志望企業の共通要素を推定し,それを使用して新規の志望企業となる可能性のある関連企業を自動的に推定する手法を開発する.例えば「キヤノン」「セイコーエプソン」「ブラザー工業」といった複数の志望企業の共通要素(「プリンタ」「複合機」など)を推定し,それを使用して新規の志望企業(「リコー」など)を自動的に推定する. また,平成28年度に開発した,決算短信PDFから業績予測文を抽出する手法について,現在のところ,業績予測に修正のある決算短信PDFのみを対象として業績予測文を抽出している.しかし,本決算の決算短信PDFにも業績予測文が存在しているので,対象の決算短信PDFの範囲を広げて、より多くの業績予測文を抽出できるようにする.
|
Causes of Carryover |
収集した大量の決算短信PDFや企業WEBページを高速に処理するためには、データ保存のストレージとして大容量のSSDの導入が必要であるが、申請時よりもSSDの低価格化が進んだため、次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
SSDの低価格化が進んだ分、より高速で大容量のSSDを導入することや、深層学習のためのGPUを導入するなどの処置を行うことで、次年度使用額を含めて予算の執行を行う所存である。
|
Research Products
(14 results)
-
-
-
-
-
-
-
-
-
[Presentation] Estimation of Tags via Comments on Nico Nico Douga2016
Author(s)
Hiroki Sakaji, Masaki Kohana, Akio Kobayashi, Hiroyuki Sakai
Organizer
The 5th International Workshop on Web Services and Social Media In conjunction with the 19th International Conference on NBiS-2016(WSSM-2016)
Place of Presentation
Ostrava, Czech Republic
Year and Date
2016-09-07 – 2016-09-09
Int'l Joint Research
-
-
-
-
-