研究課題
基盤研究(C)
本研究では,文長の分布が対数正規分布やパスカル分布,あるいは負の二項分布によって表現できるかどうかを検討した.その結果,文長の分布を確率現象としてだけ説明することは不可能であった.さらに文長に一般化線形モデルをあてはめたところ,書き手などの固定的な要因が影響している可能性が示唆された.また本研究において,日本語文章を文字や形態素,あるいは品詞に分解し,これを頻度表として出力するプログラムを開発し,これらを公表した.
すべて 2011 2010 2008 その他
すべて 学会発表 (2件) 図書 (1件) 備考 (4件)
http://groups.goog1e.com/group/rmecab
http://groups.goog1e.com/group/rcabocha