研究課題/領域番号 |
15K00315
|
研究機関 | 成蹊大学 |
研究代表者 |
酒井 浩之 成蹊大学, 理工学部, 准教授 (70402659)
|
研究分担者 |
増山 繁 豊橋技術科学大学, 工学(系)研究科(研究院), 教授 (60173762) [辞退]
坂地 泰紀 東京大学, 大学院工学系研究科(工学部), 特任講師 (70722809)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | 就職活動支援 / 企業検索 / テキストマイニング / 自然言語処理 / 業績要因文抽出 / 学習データ自動生成 |
研究実績の概要 |
本研究は,企業WEBや決算短信から,対象企業の事業に関連する情報を自動的に抽出し,その情報を検索対象とした企業検索システムのための手法の考案を目的とする.本研究成果による企業検索システムでは,学生の研究分野と関連のある企業を容易に検索することができ,学生の就職活動支援に活用できる.これにより,自分の研究分野と関連のある企業を見つけ就職志望とすることで,学生と企業とのミスマッチを防ぐ.加えて,中小企業にとっては就職情報サイトへの掲載料が高額なので登録できないのが実情であるが,本研究成果により中小企業への就職希望学生が増加することが期待できる. 上記の研究目的を達成するために,最終年度は決算短信から業績要因文を抽出する既存手法(酒井ら,2015)の改良に取り組んだ.既存手法は,精度はよいが再現率が50%程度であり,多くの業績要因文を抽出することができないという問題があった.そこで,学習データの自動生成と深層学習を組み合わせ,精度を落とすことなく再現率を72.4%まで向上させることができた. 具体的には、既存手法は高い精度を達成していることに着目し,既存手法による抽出結果をさらに絞り込むことで,より高い精度の業績要因文の集合を作成した.そして,作成された高精度の業績要因文を深層学習の学習データとすることで学習データを自動生成し,その自動生成された学習データを使用して深層学習を行い,業績要因文を抽出した.その結果,226,438文もの学習データを自動生成することができ,既存手法では抽出されなかった業績要因文をも抽出することができた. 本研究の成果を,企業名を入力するとその企業の決算短信から抽出された業績要因文を検索することができる企業検索システム(研究室WEBサイトで公開済み)に組み込み,より多くの企業の業績要因文が検索できるようになった.
|