2008 Fiscal Year Annual Research Report
Project/Area Number |
20240008
|
Research Institution | The University of Tokyo |
Principal Investigator |
田中 久美子 (石井 久美子) The University of Tokyo, 大学院・情報理工学系研究科, 准教授 (10323528)
|
Keywords | ユーザーインターフェース / 自然言語処理 / web情報処理 / 情報抽出 / 情報分類 |
Research Abstract |
web文書を閲覧する際、語学能力や知識の不足により、文書の内容を完全には理解することができなかったり、解釈判断に困ることがある。本研究の目的は、昨今研究がさかんなweb mash up技術を用いて、web文書閲覧時のユーザ支援を行うことである。具体的にはユーザがブラウザを用いてweb文書を閲覧する際、入力デバイスを用いて文書部分について指示を行うと、ブラウザpluginがその部分に関する補助情報を所定サーバと通信して取得し、提示する。この予算の目的は、web mash upのためのクライアントに関する研究と、自然言語処理を用いた各種応用サーバの研究である。 本年度の成果は大きく分けて二つである。第一に、クライアントに関して、共に研究してきた学生が夏に起業し、それまでの蓄積を産業移転し、クライアントは誰でもダウンロード可能となった。本研究では、クライアントの産業移転を申請当初掲げていたが、その意味で一つの目標は達成された。起業は特許に基づき、また競合システムも今年度は多かったため、成果を公知のものとする論文は戦略上書くことができなかった。これも含め、産業移転と研究は切り分けが難しく、初年度はこの意味で大きな経験をした。今年度はクライアントについての学術上の成果発表を行っていきたい。 第二にサーバの研究については、マーケッティング、セキュリティ、語学学習の3つの応用について当初申請した。web mash upに関する研究は今まさに旬で、産業上多くの競合者がいる。本研究の独自性を出すため、応用サーバの具体的内容は、申請当初から分野範囲内で少し変化させた。まず、マーケッティング応用に関して、当初は関連商品を提示することを提案していたが、既存研究が多い。一方、経済新聞のマイニングのニーズが高まっており、ユーザが株などの経済記事を閲覧中に類似内容中の差分をポラプアップ表示するものを構築した。現在精度向上のための基礎研究をしている。第二に、セキュリティ応用に関しては、当初悪質サイトの自動検出を提案したが、既存のウィルス検知ソフトウエアなどで確立した技術がある。一方、学生や研究者の剽窃防止が問題となっており、その検知サーバを現在構築中である。剽窃では二つの文書を付き合わせる必要があり、web mash upは効果的である。第三の語学学習応用については、当初翻訳サーバと関連技術を構築することを提案したが、競合技術が多く技術的にもトリビアルなものが多い。そこで、外国語文書を閲覧する際の総合的な支援サイトを現在設計中である。特に、外国人が日本語文書を閲覧する上での支援、そして日本人が外国語文書を閲覧するする上での支援の二つを目指す。 初年度は、研究代表者が内科関連の病気(腫瘍)になり、9月と3月末に二回入院の上、手術を行った。このため、定期的な各種検査のため国際会議への出席を予定することができず、当初予定していた今年度の旅費は、謝金や物品購入のために用いた。これを原因として今年度は本予算に直接関連する論文成果はなく,次ページに示した論文成果は本研究で将来利用することができる要素技術で、今年度出版されたものである。今年度は成果発表に務めたい。
|
Research Products
(5 results)