研究課題/領域番号 |
15K03639
|
研究機関 | 宇部工業高等専門学校 |
研究代表者 |
内田 保雄 宇部工業高等専門学校, 経営情報学科, 教授 (70321487)
|
研究分担者 |
松野 成悟 宇部工業高等専門学校, 経営情報学科, 教授 (30290795)
坂本 眞人 宮崎大学, 工学部, 准教授 (50196101)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | ビッグデータ / 可視化 / 中小企業 |
研究実績の概要 |
前年度の研究調査およびその分析と考察にもとづいて、ビッグデータ可視化システムの企画・設計を行った。グラフ可視化プラットフォームとしてはオープンソースのCytoscapeを採用することとした。 本年度は、主に技術的観点からの検討を行った。具体的には、ビッグデータを可視化するシステムの例として、EDINETで公開されている企業の有価証券報告書に記載されているデータを抽出し、Cytoscapeを用いて可視化した。そして、その過程において、主に技術的観点から、中小企業におけるビッグデータ可視化システムに必要な要件について検討し、いくつかの特性を明らかにした。 本研究では、ビッグデータの活用手順を例示することが主な目的であるので、可視化そのものの目的は以下のように限定的な内容として設定した。①収集する対象データ:EDINETで公開されている企業のデータ②可視化の目的:有価証券報告書に記載されている株主情報から株式の持ち合いに関する情報を知るための概観情報を示す。③可視化の手順:EDINETから直接Webスクレイピングせずに、EDINETの有価証券報告書データを提供しているサイトからAPIを用いてデータを取得し、いくつかの前処理をおこなった後に、Cytoscapeによりネットワーク情報としてインポートしてグラフとして可視化する。 本研究では、可視化システムに必要な要件について検討し、いくつかの特性を明らかにした。すなわち、データの収集、データの抽出などの過程において、汎用的なツールだけでは処理が困難な場面が多く存在することを示した。 今後の課題としては、対象データのクラス分けに基づいたデータ処理手順の構築ならびに可視化レイアウトの容易な選択処理ツールの開発などが挙げられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
株式の持ち合いを題材として、最終的には構造化したデータを対象として可視化を行った。まず、元のデータであるXBRLデータは半構造化データである。XBRLデータを取得するために、今回はufocatcherサービスを利用したが、原理的にはWebスクレイピングのような手段を用いる必要がある。次に、今回のように、取得したデータが複数のファイルで構成される場合は、データの抽出や結合などを行う必要がある。この作業は、データ処理ツールやプログラミング言語を使用する必要がある。また、半構造化データを構造化データに変換する場合は、汎用的なツールを適用できないことがしばしばあるが、そのような場合にはプログラミング言語に頼らなければならない。またこのとき、日本のようなマルチバイト文字の言語圏においては文字コード変換処理が必要になる場合がある、といった特性を明らかにすることができた。
|
今後の研究の推進方策 |
前年度までの研究成果をもとに、最終年度として研究目的の達成を目指す。具体的には、GUIインタフェースを有する可視化操作ツールを実装するとともに、中小企業での利用を想定した各種可視化モデルの提案および利用手順書の作成などを行う。
|
次年度使用額が生じた理由 |
参加予定国際会議を変更したため。
|
次年度使用額の使用計画 |
次年度の参加予定国際会議の参加費用に充当する。
|