2002 Fiscal Year Annual Research Report
モバイル環境における理解容易なテキスト生成のための自然言語処理に関する研究
Project/Area Number |
14019017
|
Research Institution | The University of Tokyo |
Principal Investigator |
中川 裕志 東京大学, 情報基盤センター, 教授 (20134893)
|
Co-Investigator(Kenkyū-buntansha) |
田中 久美子 (石井 久美子) 東京大学, 情報基盤センター, 助教授 (10323528)
黒橋 禎夫 東京大学, 情報理工学系研究科, 助教授 (50263108)
|
Keywords | 自動要約 / iモード / Web新聞記事 / 係り受け解析 / tf*idf / 携帯端末 / コーパス / 音声出力 |
Research Abstract |
モバイル環境においてユーザインタフェースの主要な役割を果たす携帯端末におけるテキスト情報の扱いについて研究を続けている.昨年からWebにおいて通常のパソコンをターゲットにしている新聞記事と,iモード端末をターゲットにしている新聞記事を2年間に渡って収集した。こうして収集した2種の新聞記事コーパスを同一のトピックを扱うものを自動的に対応付けしたた対応付けコーパスを利用して,自動要約の研究を進めた.目的はパソコン向けの長い記事からiモードのような携帯端末向けのコンパクトな記事を自動要約によって生成する方法である(代表者:中川が担当).まず,1日のあるジャンル(政治、経済など)の記事集合に対して、各単語のtf^*idfを計算する.一方、記事の先頭3文を掛かり受け解析し、枝の先の単語をtf^*idfの小さなものから削る。100文字要約で原文の70%,50文字要約で原文の50%程度の情報を保持することが対応コーパスを用いた評価実験で示された.また,要約のような短い記事を携帯端末において音声出力するシステムについても基礎的な検討(代表者:中川,分担者:黒橋が担当)を始め、主観評価実験の結果、iモード記事そのものよりは、Web記事中から対応する文を選択しする方法が良いとこが分かった.これに加え,ユーザインタフェースの一環として携帯端末によるユーザに優しい入力方式の研究も行った(分担者:田中が担当).
|
Research Products
(6 results)
-
[Publications] 中川 裕志: "携帯端末向けコンテンツ記述"第8回言語処理学会大会ワークショップ「社会基盤のための言語・メディア処理」. 33-40 (2002)
-
[Publications] 中川裕志, 渡部聰彦: "携帯端末向けコンテンツ変換と自然言語処理"情報処理. 43-12. 16-20 (2002)
-
[Publications] 中川裕志, 森辰則, 湯本紘彰: "出現頻度と直接頻度に基づく専門用語抽出"自然言語処理. 10-1. 27-45 (2003)
-
[Publications] 田中久美子, 犬塚祐介, 武市正人: "携帯電話における日本語入力-子音だけで日本語が入力できるか-"情報処理学会論文誌. 43-10. 3087-3096 (2002)
-
[Publications] 黒橋禎夫: "自然言語処理を支える文法"月刊「言語」. 31-4. 52-57 (2002)
-
[Publications] Kumiko Tanaka, Yusuke Inutsuka, Masato Takeichi: "Entering Text using A Four Button Device"Proceedings of COLING 2002. 988-994 (2002)