研究課題/領域番号 |
16K00418
|
研究機関 | 筑波大学 |
研究代表者 |
橋本 康弘 筑波大学, システム情報系, 助教 (10376494)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | ソーシャルタギング / Yule過程 / Simon過程 / Yule-Simon過程 / ベキ則 / Zipf則 / Heaps則 / ゆらぎ |
研究実績の概要 |
ソーシャルタギングにおける基礎的な統計として、新しい語彙の生成レート(ノベルティレート)と語彙の出現確率が示す統計則、およびそれらが示す巨視的・微視的なゆらぎの持つ性質について研究を行った。まず、ソーシャルタギングシステムを採用しているいくつかの実サービス(Delicious, Flickr, RoomClip)に対して、語彙数の成長則であるHeaps則の指数を計測し、ノベルティレートとの整合性を見た。同時に語彙の出現頻度の分布についても計測し、Zipf則、あるいはStretched Exponential分布が得られることを確認した。これは語彙の選択則において、優先的選択、あるいは非線形優先的選択が働いていることから説明できる。以上から、ソーシャルタギングの振る舞いは、その基本的な部分の多くを古典的な確率過程であるYule-Simon過程の枠組みで説明できることを示した。
さらに,Yule-Simon過程において、平均場的な考え方に依らず、数え上げの確率を用いることで、ゆらぎを含む出現数の確率分布を解析的に求めた。そこから解析を進め、Yule-Simon過程が従うゆらぎの確率分布を求めた。この解析解(近似解)は数値実験によって妥当であることが確かめられた。その上で、前述した実サービスにおける成長のゆらぎを計測したところ、Yule-Simon過程の示すゆらぎからは大きく逸脱することを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初は初年度のテーマとして、全体の統計則に関する分析とモデル化、語彙成長のゆらぎの分析に加え、語彙の選択圧となるユーザの選好のモデル化も視野に入れていた。しかし、ゆらぎの分析が想定した以上の広がりを持ち、その解析・分析に集中したため、ユーザ選好のモデル化にまで進めなかった。しかし、この語彙成長のゆらぎはユーザ選好のモデル化においても基礎となる概念であり、そこから期待以上の情報を得られたことは進捗の遅れをカバーする収穫であった。
|
今後の研究の推進方策 |
初年度に行えなかったユーザ選好のモデル化を行いながら、同時に、予定通りタグの組み合わせが持つダイナミクスについての研究を進めていく。タグの組み合わせは可能空間の中でどのような軌跡をたどり発展していくのか、生物進化の系統樹になぞらえ、その特徴を明らかにする。また、このタグの共起構造の発展はどのような成長則を持つのか、ユーザが新しいタグ、あるいは新しい組み合わせを採用する過程と関連付けながら分析を進めていく。
|
次年度使用額が生じた理由 |
当初計画していた国際会議への出席を日程の都合がつかず1件見送ったため未使用額が生じた。
|
次年度使用額の使用計画 |
未使用額は初年度購入を見送った計算機の購入に充当する。初年度は計算機を購入予定だったが、研究資料と周辺機器の購入に充当した。
|