研究課題/領域番号 |
25580093
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
言語学
|
研究機関 | 昭和大学 |
研究代表者 |
小倉 浩 昭和大学, 教養部, 准教授 (40214100)
|
研究期間 (年度) |
2013-04-01 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2014年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2013年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 自己相関関数 / 拡張指数型関数 / 確率過程 / ポアソン過程 / 非定常ポアソン課程 / Cox過程 / 言語統計 / テキストマイニング / 非定常ポアソン過程 / 機能語 / 概念語 / 非済次ポアソン過程 / 語のバースト性 |
研究成果の概要 |
テキストデータを動的な時系列データととらえる方向性での研究は少なく,従ってテキストデータの時間的な相関を問題とした研究もほとんど行われていない.本研究では,テキストデータを動的な時系列データととらえ,考えている語の文書中での出現状況の相関を表す自己相関関数を計算する方法を提案する.提案手法では,適切な自己相関関数を定義するために,語の出現過程を記述するための基本時間単位を,文書中の個々の文に設定する.文書全体の主題と密接に関連した「概念語」と,文書全体の主題と密接な関連を持たない「非概念語」に対して,それらの自己相関関数が全く異なる特徴的な振る舞いをすることを示す.
|