研究課題/領域番号 |
20860085
|
研究種目 |
若手研究(スタートアップ)
|
配分区分 | 補助金 |
研究分野 |
システム工学
|
研究機関 | 東京都立産業技術高等専門学校 |
研究代表者 |
横井 健 東京都立産業技術高等専門学校, ものづくり工学科, 助教 (40469573)
|
研究期間 (年度) |
2008 – 2009
|
研究課題ステータス |
完了 (2009年度)
|
配分額 *注記 |
3,289千円 (直接経費: 2,530千円、間接経費: 759千円)
2009年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2008年度: 1,729千円 (直接経費: 1,330千円、間接経費: 399千円)
|
キーワード | テキストマイニング / トピック抽出 / 特徴量抽出 / 自然言語処理 / 情報フィルタリング |
研究概要 |
本研究では、大規模な文書集合における潜在的意味(トピック)に着目し、そのトピックを用いて文書情報を表現する特徴量を選別する手法を提案した。特に、大規模な文書集合からトピックを取得するために、分割したそれぞれの文書集合から得られたトピックを結合することで、もとの大規模な文書集合を直接扱う場合に近いトピックを取得する手法を提案した。また、その手法によって得られた特徴量をユーザの興味情報による情報フィルタリングに応用することで、その特徴量の有用性を検証した。
|