• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

携帯メールの書き手の同定に関する統計的研究

研究課題

研究課題/領域番号 19650067
研究種目

挑戦的萌芽研究

配分区分補助金
研究分野 統計科学
研究機関同志社大学

研究代表者

金 明哲  同志社大学, 文化情報学部, 教授 (60275469)

研究分担者 村上 征勝  同志社大学, 文化情報学部, 教授 (00000216)
研究期間 (年度) 2007 – 2009
研究課題ステータス 完了 (2009年度)
配分額 *注記
3,300千円 (直接経費: 3,300千円)
2009年度: 700千円 (直接経費: 700千円)
2008年度: 900千円 (直接経費: 900千円)
2007年度: 1,700千円 (直接経費: 1,700千円)
キーワード携帯メールの書き手 / 絵文字のカテゴリ化 / データマイニング / サポートベクターマシン / ランダムフォレスト / 携帯メール / データの収集
研究概要

携帯メールの文面情報を構成する主な要素は、文字列と絵文字・顔文字である。携帯メールの中で同じ意味やニュワンスで用いる絵文字・顔文字は、機種によって形状が異なる。携帯機種に依存しない書き手の特徴データを抽出するため、本研究では絵文字について感情を表すもの、身振り・抑揚を表すもの、装飾として用いられているもののようにカテゴリ化し、データ集計を行った。文字列データ関しては、機械的に集計を行った。
21年度は、これらのデータ抽出の見直しおよびチェックとそのデータに基づいた書き手の識別について繰り返し実験を行った。実験分析では、絵文字・顔文字データ、文面の文字列データを結合し、サポートベクターマシン法、バキング法、ブースティング法、ランダムフォレスト法など機械学習法の分類器を用いた。正解率の評価は交差確認法を用いた。
その結果、正解率は分類器によって若干異なるが、平均約90%の正解率で書き手を同定することが可能であることが分かった。しかし、書き手の同定の正解率は、同定すべく書き手の組み合わせによって、そのバラツキが大きい。任意の2人間の場合、交差確認法による正解率の範囲は約70%~99%になることが分かった。
また、本年度ではメールの書き手の同定に関連する研究として、文学作品の書き手の同定や執筆時期の推定などに関する次の研究も行った。
川端康成の作品の中で三島由紀夫が代筆したと言われている作品の書き手の同定
文章の執筆時期の推定-芥川龍之介の作品を例として-

報告書

(3件)
  • 2009 実績報告書
  • 2008 実績報告書
  • 2007 実績報告書
  • 研究成果

    (35件)

すべて 2010 2009 2008 2007 その他

すべて 雑誌論文 (15件) (うち査読あり 2件) 学会発表 (10件) 図書 (7件) 備考 (3件)

  • [雑誌論文] 文章の執筆時期の推定-芥川龍之介の作品を例として-2009

    • 著者名/発表者名
      金明哲
    • 雑誌名

      行動計量学 第36巻第2号

      ページ: 89-103

    • NAID

      10025991793

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] カイ2乗統計量によるテキスト分析2009

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 178

      ページ: 42-47

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] テキストの特徴分析2009

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 179

      ページ: 44-49

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] テキストのクラスター分析2009

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA N0. 180

      ページ: 36-41

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 統計的テキスト解析とテキストマイニング2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 168

      ページ: 54-59

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] データのクリーニングと関連ツール2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 169

      ページ: 48-53

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 形態素解析と構文解析2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 170

      ページ: 50-55

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 統計モデルと集計ツール2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 171

      ページ: 44-49

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 統計法則と指標2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 172

      ページ: 60-65

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 語のネットワーク分析2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 173

      ページ: 58-63

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] テキストの記述統計2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 174

      ページ: 46-51

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 確率分布によるモデリング2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 175

      ページ: 41-46

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] テキストにおける情報量2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 176

      ページ: 44-49

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] テキストにおける推測統計2008

    • 著者名/発表者名
      金明哲
    • 雑誌名

      ESTRELA No. 177

      ページ: 44-49

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] ランダムフォレスト法による文章の書き手の同定2007

    • 著者名/発表者名
      金 明哲・村上 征勝
    • 雑誌名

      統計数理 第55巻第2号

      ページ: 156-168

    • NAID

      120006019039

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [学会発表] テキストマイニングの基本的な考え方と諸種の実践事例2009

    • 著者名/発表者名
      金明哲
    • 学会等名
      応用統計学会チュートリアル講演
    • 発表場所
      京都大学医学部G棟(京都市)
    • 年月日
      2009-11-28
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 統計的テキスト処理と情報編纂2009

    • 著者名/発表者名
      金明哲
    • 学会等名
      人工知能学会情報編纂研究会チュートリアル講演
    • 発表場所
      東京大学駒場キャンパス(東京都)
    • 年月日
      2009-11-20
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Authorship Identification with Same Classifiers2009

    • 著者名/発表者名
      Mingzhe Jin, Masakatsu Murtakami, Yuejun Zheng
    • 学会等名
      2009 International Institute of Applied Statistics
    • 発表場所
      中国海洋大学国際学術交流センター(中国青島)
    • 年月日
      2009-07-26
    • 関連する報告書
      2009 実績報告書
  • [学会発表] テキストマイニングの現状と課題2009

    • 著者名/発表者名
      金明哲
    • 学会等名
      2009 International Institute of Applied Statistics
    • 発表場所
      中国海洋大学国際学術交流センター(中国青島)
    • 年月日
      2009-07-26
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 文章の執筆時期は推定できるか?2008

    • 著者名/発表者名
      金明哲
    • 学会等名
      日本計量国語学会第52回大会
    • 発表場所
      武庫川女子大学
    • 年月日
      2008-09-20
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 小倉左遷前後における森鴎外の文体変化2008

    • 著者名/発表者名
      桑野麻友子, 金明哲
    • 学会等名
      日本計量国語学会第52回大会
    • 発表場所
      武庫川女子大学
    • 年月日
      2008-09-20
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 携帯電話の文面情報から書き手を探る2008

    • 著者名/発表者名
      田中量子・金明哲
    • 学会等名
      2009年度 統計関連学会連合大会
    • 発表場所
      同志社大学(京田辺市)
    • 年月日
      2008-09-09
    • 関連する報告書
      2009 実績報告書
  • [学会発表] テキスト分類とカーネル関数2008

    • 著者名/発表者名
      金明哲
    • 学会等名
      2009年度 統計関連学会連合大会
    • 発表場所
      同志社大学(京田辺市)
    • 年月日
      2008-09-09
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 多言語テキストマイニングの環境-日本語、中国語、韓国語を中心として-2008

    • 著者名/発表者名
      金明哲
    • 学会等名
      2009年度 統計関連学会連合大会
    • 発表場所
      同志社大学(京田辺市)
    • 年月日
      2008-09-09
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 芥川龍之介の文体の変化ー助詞を中心として2007

    • 著者名/発表者名
      金 明哲
    • 学会等名
      行動計量学会第35回大会
    • 発表場所
      同志社大学
    • 関連する報告書
      2007 実績報告書
  • [図書] カテゴリカルデータ解析2010

    • 著者名/発表者名
      金明哲(編)
    • 総ページ数
      192
    • 出版者
      共立出版
    • 関連する報告書
      2009 実績報告書
  • [図書] テキストデータの統計科学入門2009

    • 著者名/発表者名
      金明哲(著)
    • 総ページ数
      244
    • 出版者
      岩波書店
    • 関連する報告書
      2009 実績報告書
  • [図書] マシンラーニング2009

    • 著者名/発表者名
      金明哲(編)
    • 総ページ数
      233
    • 出版者
      共立出版
    • 関連する報告書
      2009 実績報告書
  • [図書] パターン認識2009

    • 著者名/発表者名
      金明哲(編)
    • 総ページ数
      273
    • 出版者
      共立出版
    • 関連する報告書
      2009 実績報告書
  • [図書] ネットワーク分析2009

    • 著者名/発表者名
      金明哲(編)
    • 総ページ数
      178
    • 出版者
      共立出版
    • 関連する報告書
      2009 実績報告書
  • [図書] 多次元データ解析法2009

    • 著者名/発表者名
      金明哲(編)
    • 総ページ数
      248
    • 出版者
      共立出版
    • 関連する報告書
      2009 実績報告書
  • [図書] Rによるデータサイエンス2007

    • 著者名/発表者名
      金 明哲
    • 総ページ数
      307
    • 出版者
      森北出版
    • 関連する報告書
      2007 実績報告書
  • [備考]

    • URL

      http://mjin.doshisha.ac.jp

    • 関連する報告書
      2009 実績報告書
  • [備考]

    • URL

      http://mjin.doshisha.ac.jp

    • 関連する報告書
      2008 実績報告書
  • [備考]

    • URL

      http://mjin.doshisha.ac.jp

    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2007-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi