研究課題/領域番号 |
15K00315
|
研究機関 | 成蹊大学 |
研究代表者 |
酒井 浩之 成蹊大学, 理工学部, 准教授 (70402659)
|
研究分担者 |
増山 繁 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (60173762)
坂地 泰紀 成蹊大学, 理工学部, 助教 (70722809)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | 就職活動支援 / 企業検索 / テキストマイニング / 自然言語処理 / 関連企業検索 / 因果関係抽出 / 業績要因抽出 |
研究実績の概要 |
本研究は,企業WEBページや決算短信から、対象企業の事業に関連する情報を自動的に抽出し、その情報を検索対象とした企業検索システムのための手法の考案を目的とする。本研究成果による企業検索システムでは、学生の研究分野と関連のある企業を容易に検索することができ、学生の就職活動支援に活用できる。これにより、自分の研究分野と関連のある企業を見つけ、就職志望とすることで、学生と企業とのミスマッチを防ぐ。加えて、中小企業にとっては就職情報サイトへの掲載料が高額なので登録できないのが実情であるが、本研究成果により、中小企業への就職希望学生が増加することが期待できる。 上記の研究目的を達成するために、本年度は、決算短信PDFを収集し、収集した決算短信PDFから業績要因と因果関係(原因と結果)を抽出する研究を行った。その成果を用いて、例えば原因として「猛暑」、結果として「エアコン」を入力すると,原因が「猛暑」で結果が「エアコン」を含む因果関係を情報として記述している決算短信PDFとその企業を検索することができる企業検索システムを開発し,研究室WEBサイトにて公開した(http://hawk.ci.seikei.ac.jp/CS/)。 また,企業WEBページを収集し、収集した企業WEBページからその企業の事業に関連するキーワードを抽出し,そのキーワードを使用して,ある企業と関連のある企業を抽出する研究を行った.その成果を用いて,企業名を入力すると、その企業と関連のある企業を検索することができる関連企業検索システムを開発し、研究室WEBサイトにて公開した(http://hawk.ci.seikei.ac.jp/LicsPlus/)。本システムでは、例えば「エプソン」で検索すると「ブラザー工業」が検索され、興味のある企業と関連のある企業を検索する場合に有効である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成27年度は、(1)企業WEBページ、および、決算短信PDFの収集、(2)決算短信PDFからの業績要因の抽出を行う予定であったが、上記の課題は予定どおり完了した。さらに、決算短信PDFからの業績要因抽出を発展させ、因果関係(原因と結果)を抽出する研究を行い、それを完了することができた。また、平成28年度に行う予定であった、企業WEBページからその企業の事業に関連するキーワードの抽出に関して、予備的検討を行った。そのため、本研究課題は「おおむね順調に進展している」と判断した。
|
今後の研究の推進方策 |
平成28年度以降は、企業の事業概要の自動生成について取り組む。現在の企業検索システム(http://hawk.ci.seikei.ac.jp/LicsPlus/)では、検索された企業の事業概要としてトップページに含まれるmetaタグのdescriptionの記述を表示している。しかしながら、descriptionに事業の内容が書かれていない企業(例えば「株式会社○○のトップページです。」としか書かれていない場合)や、descriptionに記述がない企業も多く存在する。そこで、収集した企業WEBページや事業に関連する情報から、企業の事業概要を自動生成する。また、平成27年度で検討した「企業WEBページからその企業の事業に関連するキーワードの抽出」について、より高い精度を目指す。現在のところ、企業WEBページから例えば「個人情報保護基本方針」のような事業に関連のない語も抽出されており、そのような語を除去できる手法を開発する必要がある。
|
次年度使用額が生じた理由 |
収集した大量の決算短信PDFや企業WEBページを高速に処理するためには、データ保存のストレージとして大容量のSSDの導入が必要であるが、申請時よりもSSDの低価格化が急速に進んだため、次年度使用額が生じた。
|
次年度使用額の使用計画 |
SSDの低価格化が進んだ分、より高速で大容量のSSDを導入するなどの処置を行うことで、次年度使用額を含めて予算の執行を行う所存である。
|