研究課題/領域番号 |
18K18597
|
研究機関 | 信州大学 |
研究代表者 |
森川 英明 信州大学, 学術研究院繊維学系, 教授 (10230103)
|
研究期間 (年度) |
2018-06-29 – 2024-03-31
|
キーワード | 繊維材料 / 衣生活 / テキストマイニング / 多変量解析 |
研究実績の概要 |
データに基づく学術情報の俯瞰は重要性を増している.本研究では,計量書誌学的手法,科学計量学的手法を用いた学術情報の分析手法を検討し,その結果から科学・技術と社会や生活変化の動向との接点を見つけることで,新たな研究の方向性を探索する手法を確立する研究課題である.これまで学術情報の事例として「繊維科学」分野を対象に分析を進めた.具体的には1931年から刊行されている「Textile Research Journal」を採り上げ,1931年~2020年までの90年分13,173報の論文タイトルを収集し,これらテキスト情報をKHCoder(Ver.3.0)を用いて分析を進めてきた.まず網羅的に形態素分析を行い,出現回数上位30語の名詞の絞り込みを行うと共に,対応分析によりマッピングを行った.90年分一括での分析は視覚化が困難だったため,論文を10年ごとに分割した9つの変数と単語について対応分析を行った.その後,特徴的な年代のみをピックアップし,詳細についても検討・考察を行った. その結果,1930年代から2000年代にかけて,年代ごとの変化が見られた.特に1930年代~1950年代にかけては「cotton」「wool」「hemp」といった天然繊維素材や,「dye」といった染色に関するワードが特徴的であった.一方で2010年代を境に大きく変化しており,「textile」「property」「process」など性能や工程に関する新たな研究が多く採り上げられていた傾向が見られた.このことから論文タイトルによる対象分野の研究の年代的な変化を,テキストマイニングと対応分析により捕捉できる手法の一定の有効性について検証ができたと考える.ただ一つの雑誌情報からの単一の解析であることから,今後,当時の産業動向や関連する他の資料にあたるなど,さらに詳細な検証が必要と考えている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
繊維材料をモデルケースとして手法の構築を進めているが,学術雑誌のテキストデータの取り扱いについて,当初考えていた以上に段階的なデータクリーニングが煩雑であり,効果的な手法にたどり着けていない.対象雑誌についても「Textile Research Journal」だけでなく「The Textile Institute」など他の雑誌も想定しているが,取りかかれていない.
|
今後の研究の推進方策 |
今後は,学術情報の形態素分析後のデータの取り扱い(例えばデータクリーニング方法)の再検討を行うと共に,分析手法についても対応分析など多変量解析的な手法だけでなく,ベイズ推定など新たな解析・予測手法についても検討を進めたい.一方で学術情報と社会・生活とのインタラクションによる新たな融合的テーマの創成について,知識マネジメント手法の適応を検討し,最終的な目標に向けた諸手法の体系化を進める予定である.
|
次年度使用額が生じた理由 |
当初の計画では,学術情報のテキストマイニングおよび多変量解析手法を構築し,その後,数多くの雑誌によるビッグデータによる解析を実施する予定であった.まだ解析手法の確立に至っていないため,高性能コンピュータによるビッグデータ解析に進めることができていない.手法が構築でき次第,高性能コンピュータ等を導入し,解析を進めることから,本予算を次年度に計画したい.
|