研究課題/領域番号 |
13J08349
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
大澤 昇平 東京大学, 工学系研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2013-04-01 – 2015-03-31
|
研究課題ステータス |
完了 (2014年度)
|
配分額 *注記 |
1,800千円 (直接経費: 1,800千円)
2014年度: 900千円 (直接経費: 900千円)
2013年度: 900千円 (直接経費: 900千円)
|
キーワード | 機械学習 / ウェブ / 情報統合 / 人物属性 / エキスパート検索 / クラウドソーシング / ソーシャルメディア / Facebook / エンティティ / クローラ / 意味的構造 / DBpedia / 知識データ / 人気度予測 |
研究実績の概要 |
■ウェブマイニングのための検索APIを利用したサンプリング手法に関する研究 サンプリングはウェブマイニングにおいて重要な問題であり,アプリケーション・プログラミング・インターフェース(以下,API)を通して効率的にサンプリングする問題を扱う研究が盛んにおこなわれている.本活動ではその中でも特に検索 API に着目したサンプリング問題に焦点を当て,Wikipediaのようなオントロジを活用した辞書ベースのサンプリング手法を提案する.実験では,Facebook からデータを独自にクローリングしたデータに基づき仮想的な APIを構築し,ε-グリーディやε-ファーストなどの強化学習に基づく方策を比較する.
■OSS コミュニティおよびクラウドソーシングの統合によるソフトウェア開発者の能力予測に関する研究 クラウドソーシングサービスを対象に開発者の能力の推定が行われている.ソフトウェア開発プロジェクトの成功は,開発者の能力に依存するが,こうした能力を推定するのは自明な問題でない.一般に,クラウドソーシングサービスでは,能力はユーザによって評価付けされる.本活動では,オープンソースソフトウェア(OSS)コミュニティとクラウドソーシングサービスを統合することにより,ソフトウェア開発者の能力を推定することを目的とする.まず,能力の推定問題が OSS コミュニティからの素性生成の問題に帰着されることを示し,開発物に基づき開発者の能力を抽象化した値であるs-indexを提案する.具体的には,oDesk (クラウドソーシングサービス)および GitHub (OSS コミュニティ)を統合し,oDesk から得られるデータを教師データする評価値予測モデルを構築する.実験結果では,s-index を用いたモデルが nDCG の観点から用いないモデルよりも上回っていることを示す.
|
現在までの達成度 (段落) |
26年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
26年度が最終年度であるため、記入しない。
|