研究課題/領域番号 |
15H03389
|
研究機関 | 関西学院大学 |
研究代表者 |
大内 章子 関西学院大学, 経営戦略研究科, 准教授 (20335110)
|
研究分担者 |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
中原 孝信 専修大学, 商学部, 講師 (60553089)
羽室 行信 関西学院大学, 経営戦略研究科, 准教授 (90268235)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
キーワード | 女性労働 / ビッグデータ |
研究実績の概要 |
本年度はまず、データベースの構築として、クローリングプログラムの作成、Twitterクローリングとデータベース化、イベントデータベースの構築を進めた。そして実際に、育児休業3年を求めた安倍首相の発言に関する人々の考えについて、Twitterデータ(28万件)を取得し、テキストマイニングを行い、意見の抽出方法を提案した。 具体的には、類似した文章をクラスタリングすることでテーマごとに意見抽出や重要文章の抽出方法を確立することを狙いに、文章分類と意見抽出を行った。2部グラフから研磨後の極大2部クリークをトピックとして扱い、共通するトピックを持つツィートをクラスタリングした。クラスタ内のツィートは分類できたが、文章の類似性の判断が難しいため、被験者の協力を得て文章の評価実験を実施した。その結果、これまでは分類モデルの説明変数としてクラスタの有用性を示せなかったが、クラスタリングの性能を評価できた。 Twitterデータを利用した分析を進める一方、短文とサンプルの偏りを持つTwitterデータの欠点を補うためのアンケート調査を実施した。本年度は、育休を取得した人と取得せずに退職した人へのアンケート調査から、育休取得せずに退職する理由を明らかにし、仕事・育児両立のための施策を評価し提案することを試みた。その結果、家族状況要因の改善が育休取得に強い影響を与えること、ワーク・ライフ・バランスを改善することで育休取得に間接的な効果があることが示された。 こうした研究を進める中で、単発のアンケート調査ではTwitterの短文とサンプルの偏りを十分に補えないことが明らかになった。そこで継続的アンケート調査を行って人々の率直な意見を収集できるSNSサイトを構築することにして、オープンソースのSNSパッケージを基盤にして、必要最小限の機能を実装した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2015年度は研究開始初年度であり、ビッグデータを利用した育児休業などの女性の働き方に関する意見の抽出を行うための基礎技術の構築を目的に実施することを考えており、現在までに、Twitterのクローリングとデータベース化を実施する方法は開発しており、日々育児休業に関する意見の抽出を行っている。またイベントデータベースを構築するために、新聞記事とテレビの番組データなどの収集を実施した。新聞記事に関しては新聞記事については日経テレコン21などの既存のデータベースを利用した。更に取得した文書を要約するためのマイクロクラスタリングの適用などを行うためのツール開発などを実施した。 1年目ではこれらのデータ収集に関するタスクと並行し、収集したデータを解析することで、研究実績で示したように幾つかの知見が得られており、学会などで報告を行った。また、Twitterデータのサンプルの偏りを補うために、アンケート調査も実施しており、これらを踏まえて当初の研究計画を十分カバーできていると判断できる。一方で、極性評価表現辞書の構築は若干遅れていおり、これを2年目に実施する。また、これまでのTwitterデータとアンケート調査だけでは、本音を捉えるという観点からは不十分な点もでてきており、当初の研究計画では想定していなかったSNSサイトの構築に着手し始めた。
|
今後の研究の推進方策 |
今後は、第一に、これまでの研究をさらに進めて、テキスト解析に関する手法を確立していく。具体的には、まず、データベースの構築では、収集したツイートおよびWebニュースについて、テキストの格フレーム解析を行い、それらをデータベース化する。そして、ツイートを要約する技術‐概念辞書の構築とイベント要約‐を開発する。第二に、当初の計画では想定していなかったSNSサイトについて、継続的に多様な意見を収集する目的を果たすために改良して実運用を目指す。
|