• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

携帯メールの書き手の同定に関する統計的研究

Research Project

Project/Area Number 19650067
Research InstitutionDoshisha University

Principal Investigator

金 明哲  Doshisha University, 文化情報学部, 教授 (60275469)

Co-Investigator(Kenkyū-buntansha) 村上 征勝  同志社大学, 文化情報学部, 教授 (00000216)
Keywords携帯メールの書き手 / 絵文字のカテゴリ化 / データマイニング / サポートベクターマシン / ランダムフォレスト
Research Abstract

携帯メールの文面情報を構成する主な要素は、文字列と絵文字・顔文字である。携帯メールの中で同じ意味やニュワンスで用いる絵文字・顔文字は、機種によって形状が異なる。携帯機種に依存しない書き手の特徴データを抽出するため、本研究では絵文字について感情を表すもの、身振り・抑揚を表すもの、装飾として用いられているもののようにカテゴリ化し、データ集計を行った。文字列データ関しては、機械的に集計を行った。
21年度は、これらのデータ抽出の見直しおよびチェックとそのデータに基づいた書き手の識別について繰り返し実験を行った。実験分析では、絵文字・顔文字データ、文面の文字列データを結合し、サポートベクターマシン法、バキング法、ブースティング法、ランダムフォレスト法など機械学習法の分類器を用いた。正解率の評価は交差確認法を用いた。
その結果、正解率は分類器によって若干異なるが、平均約90%の正解率で書き手を同定することが可能であることが分かった。しかし、書き手の同定の正解率は、同定すべく書き手の組み合わせによって、そのバラツキが大きい。任意の2人間の場合、交差確認法による正解率の範囲は約70%~99%になることが分かった。
また、本年度ではメールの書き手の同定に関連する研究として、文学作品の書き手の同定や執筆時期の推定などに関する次の研究も行った。
川端康成の作品の中で三島由紀夫が代筆したと言われている作品の書き手の同定
文章の執筆時期の推定-芥川龍之介の作品を例として-

  • Research Products

    (15 results)

All 2010 2009 2008 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (7 results) Book (6 results) Remarks (1 results)

  • [Journal Article] 文章の執筆時期の推定-芥川龍之介の作品を例として-2009

    • Author(s)
      金明哲
    • Journal Title

      行動計量学 第36巻第2号

      Pages: 89-103

    • Peer Reviewed
  • [Presentation] テキストマイニングの基本的な考え方と諸種の実践事例2009

    • Author(s)
      金明哲
    • Organizer
      応用統計学会チュートリアル講演
    • Place of Presentation
      京都大学医学部G棟(京都市)
    • Year and Date
      2009-11-28
  • [Presentation] 統計的テキスト処理と情報編纂2009

    • Author(s)
      金明哲
    • Organizer
      人工知能学会情報編纂研究会チュートリアル講演
    • Place of Presentation
      東京大学駒場キャンパス(東京都)
    • Year and Date
      2009-11-20
  • [Presentation] Authorship Identification with Same Classifiers2009

    • Author(s)
      Mingzhe Jin, Masakatsu Murtakami, Yuejun Zheng
    • Organizer
      2009 International Institute of Applied Statistics
    • Place of Presentation
      中国海洋大学国際学術交流センター(中国青島)
    • Year and Date
      2009-07-26
  • [Presentation] テキストマイニングの現状と課題2009

    • Author(s)
      金明哲
    • Organizer
      2009 International Institute of Applied Statistics
    • Place of Presentation
      中国海洋大学国際学術交流センター(中国青島)
    • Year and Date
      2009-07-26
  • [Presentation] 携帯電話の文面情報から書き手を探る2008

    • Author(s)
      田中量子・金明哲
    • Organizer
      2009年度 統計関連学会連合大会
    • Place of Presentation
      同志社大学(京田辺市)
    • Year and Date
      2008-09-09
  • [Presentation] テキスト分類とカーネル関数2008

    • Author(s)
      金明哲
    • Organizer
      2009年度 統計関連学会連合大会
    • Place of Presentation
      同志社大学(京田辺市)
    • Year and Date
      2008-09-09
  • [Presentation] 多言語テキストマイニングの環境-日本語、中国語、韓国語を中心として-2008

    • Author(s)
      金明哲
    • Organizer
      2009年度 統計関連学会連合大会
    • Place of Presentation
      同志社大学(京田辺市)
    • Year and Date
      2008-09-09
  • [Book] カテゴリカルデータ解析2010

    • Author(s)
      金明哲(編)
    • Total Pages
      192
    • Publisher
      共立出版
  • [Book] テキストデータの統計科学入門2009

    • Author(s)
      金明哲(著)
    • Total Pages
      244
    • Publisher
      岩波書店
  • [Book] マシンラーニング2009

    • Author(s)
      金明哲(編)
    • Total Pages
      233
    • Publisher
      共立出版
  • [Book] パターン認識2009

    • Author(s)
      金明哲(編)
    • Total Pages
      273
    • Publisher
      共立出版
  • [Book] ネットワーク分析2009

    • Author(s)
      金明哲(編)
    • Total Pages
      178
    • Publisher
      共立出版
  • [Book] 多次元データ解析法2009

    • Author(s)
      金明哲(編)
    • Total Pages
      248
    • Publisher
      共立出版
  • [Remarks]

    • URL

      http://mjin.doshisha.ac.jp

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi