• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 研究成果報告書

文長にみる言語の確率分布

研究課題

  • PDF
研究課題/領域番号 20520389
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 言語学
研究機関徳島大学

研究代表者

石田 基広  徳島大学, 大学院・ソシオ・アーツ・アンド・サイエンス研究部, 准教授 (40232318)

研究期間 (年度) 2008 – 2010
キーワード計量言語学 / テキストマイニング / 日本語 / 英語 / 独語
研究概要

本研究では,文長の分布が対数正規分布やパスカル分布,あるいは負の二項分布によって表現できるかどうかを検討した.その結果,文長の分布を確率現象としてだけ説明することは不可能であった.さらに文長に一般化線形モデルをあてはめたところ,書き手などの固定的な要因が影響している可能性が示唆された.また本研究において,日本語文章を文字や形態素,あるいは品詞に分解し,これを頻度表として出力するプログラムを開発し,これらを公表した.

  • 研究成果

    (7件)

すべて 2011 2010 2008 その他

すべて 学会発表 (2件) 図書 (1件) 備考 (4件)

  • [学会発表] 言語データの統計解析2011

    • 著者名/発表者名
      石田基広
    • 学会等名
      日本語学会2011年度春季大会予稿集,54-57頁
    • 発表場所
      大阪大学
    • 年月日
      2011-05-28
  • [学会発表] RMeCabとRCaBoChaによるテキストマイニング2010

    • 著者名/発表者名
      石田基広
    • 学会等名
      統計連合学会連合大会講演報告集,292-293頁
    • 発表場所
      早稲田大学
    • 年月日
      2010-09-08
  • [図書] Rによるテキストマイニング入門2008

    • 著者名/発表者名
      石田基広
    • 総ページ数
      173
    • 出版者
      森北出版
  • [備考] ホームページ等

  • [備考] 言語解析用ソフトの開発と公開

  • [備考] 形態素解析インターフェイスRMeCab

    • URL

      http://groups.goog1e.com/group/rmecab

  • [備考] 係り受け解析インターフェイスRCaBoCha

    • URL

      http://groups.goog1e.com/group/rcabocha

URL: 

公開日: 2012-01-26   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi