今年度は,研究対象現象の理解や共同研究の開始等の今後の成果化につながる以下の2点の進展があった. (1)ブログにおける新語の普及の研究: 日本中のブログにおける新語の出現頻度の時間変化の研究をさらに進めた.結果,2つパラメータ相違で多くの新語時系列が体系的に説明できる簡単な微分方程式があることを明らかにした.今後,このパラメータと新語のキーワードとの定性的な性質の関係をつきとめ,論文成果化を行う予定である. (2)明治大正昭和の過去新聞データに関する研究: 情報システム研究機構の人文学オープンデータセンターとの歴史日本語文書のOCR研究チームとの共同研究を開始した. それに関連して,専用ソフトにより暗号化された新聞画像データの朝刊約100年分に関して画像解析可能なpdfデータへの変換を完了した. また,OCRの前処理にあたる新聞のレイアウト解析等の基礎的研究にも進展があった. 加えて,関連してブログデータからみられる社会的記憶については,高大連携事業において,高校生との研究もおこなった.
|