2006 Fiscal Year Annual Research Report
Project/Area Number |
15200010
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
植村 俊亮 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00203480)
|
Co-Investigator(Kenkyū-buntansha) |
宮崎 純 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (40293394)
中島 伸介 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90399535)
天笠 俊之 筑波大学, 計算科学研究センター, 講師 (70314531)
波多野 賢治 同志社大学, 文化情報学部, 講師 (80314532)
前田 亮 立命館大学, 情報理工学部, 助教授 (20351322)
|
Keywords | 多言語情報処理 / Webディレクトリ / 情報検索 / 情報推薦 / タグ |
Research Abstract |
本年度は、1.複数の言語版のあるWebディレクトリを利用し、その各カテゴリのカテゴリ階層と、そこに登録されているWebページ中から対訳関係にある単語の関係を調査し、対訳関係の単語抽出に適切なカテゴリ階層の決定について評価を行った。また、2.Webページの推薦を、各ユーザが付与したタグ情報を利用して高精度でWebページを推薦する方式の提案を行った。 1.の各カテゴリのカテゴリ階層の決定に関しては、どの階層まで各言語版のWebディレクトリの対応付けを行えばよいかを詳細に調査した。より深い階層に対して精密な対応づけを行えば、精度の高い言語資源を獲得できる反面、統計量としては不十分となる。逆に浅い階層までの対応づけでは精度の低い言語資源しか得られない。Yahoo!ディレクトリの日本語と英語版のそれぞれを詳細に対応付けし、NTCIRのテストコレクションを利用した多言語検索の実験により、トップディレクトリから2階層のときに、多言語検索の精度が最大となることを明らかにした。 2.のタグ情報を利用したWebページの推薦システムの高精度化に関しては、ユーザとWebページの関連を、ユーザが各Webページに対して評価したタグ情報を利用して高精度にスコア付けするアルゴリズムを提案した。このアルゴリズムにより、記述された言語に関係なく各ユーザの望むWebページの推薦を行うことができる。評価実験によれば、リンク関係だけによるWebページの推薦よりも、より正確に情報推薦を行えることが分かった。タグ情報は、記述される言語に非依存かっWebページに対する抽象的な評価であり、多言語情報に対してユーザの要求する情報を高精度で提示することが可能である。この成果は、セマンティックウェブにも深く関連しており、タグとして付与された抽象概念をオントロジとして扱うことで、より広範な応用につながる可能性がある。
|
Research Products
(7 results)