2014 Fiscal Year Annual Research Report
コミュニティメディアからの知識抽出に基づくソーシャルキャピタルの変容過程の解明
Project/Area Number |
25280110
|
Research Institution | University of Tsukuba |
Principal Investigator |
佐藤 哲司 筑波大学, 図書館情報メディア系, 教授 (70396117)
|
Co-Investigator(Kenkyū-buntansha) |
寶珍 輝尚 京都工芸繊維大学, 工芸科学研究科, 教授 (00251984)
関 洋平 筑波大学, 図書館情報メディア系, 助教 (00348468)
手塚 太郎 筑波大学, 図書館情報メディア系, 准教授 (40423016)
若林 啓 筑波大学, 図書館情報メディア系, 助教 (40631908)
池内 淳 筑波大学, 図書館情報メディア系, 准教授 (80338607)
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 機械学習 / ウェブサイエンス / 時系列データ解析 / ユーザプロファイル / ツイッター / コミュニティQA |
Outline of Annual Research Achievements |
大量のツイートに対して、交通や気象、購買など実生活の局面をラベル付けする階層化推定法を提案・評価した。一層目は一般的なLDA法を採用しているが、二層目に新規考案したエントロピーを最大化する推定法を導入することで、短文ツイートであっても少ない学習データ数で推定精度を向上できることを明らかにした。提案法は、種々の機械学習手法を階層的に構成するフレームワークとしても機能することから、多階層のディープラーニングに発展できる枠組みとして期待できる。 ツイッターユーザの投稿数などの時間的変化でクラスターを形成し、クラスター間遷移のモデル化手法を提案した。実ユーザのプロファイルを分析し、投稿停止状態に至る直前の状態が限定的であることを明らかにした。また、ネットワーク利用者の信頼の単位であるコミュニティを抽出する手法として、ツイッターのリプライを多重有向リンクとしてモデル化し、再帰的にコア部を抽出するMDSR法を提案評価した。大量な実ツイートデータに提案法を適用し、特徴的なコミュニティを抽出できることを確認した。 質問回答文の特徴量から質問回答文の印象を推定し、印象に基づく質問と回答者の関連性評価手法を開発した。実際のデータで実験・評価を行い、良好な結果が得られたことから,質問回答文を題材とするある種の知識獲得に成功したと考えられる。 ソーシャルメディアに投稿されたテキスト対話情報から、利用者間の関係を詳細に解析するための発話タイプ推定手法を提案した。テキスト対話に固有の同時進行性という特徴を考慮した機械学習モデルの提案により、有効な発話タイプが推定できることを確認した。テキストの意味的側面を分析するための概念的類似度獲得手法の評価や、構造的側面を分析するための確率文脈自由文法(PCFG)の高速推論手法の提案を行い、さらに詳細なテキスト特徴抽出のための機械学習技術の基礎を構築した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ソーシャルキャピタルを形成する三つの要素である、信頼の醸成、規範の形成、ネットワークの成長のそれぞれに関して、大規模なツイートデータから信頼できる有用なツイートを判別する階層化推定法、時系列分析に基づくツイッターユーザのプロファイル抽出法、リプライ構造に基づくコミュニティ抽出法を提案し、実装評価を行うことができている。
|
Strategy for Future Research Activity |
これまでの研究で、典型的なコミュニティメディアであるツイッターを対象に、多面的な知識抽出手法を提案・評価してきている。今後の進め方として、変容過程すなわち時間経過に伴って変化するユーザ、コンテンツ、更にはコミュニティの経時的な分析に重点をおいた研究を展開していくこととしたい。 特に、ツイッターユーザの投稿活動の経時的変化に着目したユーザプロファイルの抽出精度を向上するとともに、特徴的なユーザ群がコミュニティに果たす役割とその変容を明らかにする研究を進めていくこととしたい。情報リテラシーが十分に身についていない年少者までコミュニティメディアが普及した情報化社会において、このような研究に対する社会的な要請は高いと言える。
|
Causes of Carryover |
年度末に執行したその他経費が見込み額よりも安価であったことから残金が生じた。
|
Expenditure Plan for Carryover Budget |
繰越額と併せて執行する。研究計画の後半期に入ることから、成果発表に関わる経費として有効に活用する。
|
Research Products
(35 results)