研究課題
英語で採用されているTimeML1.2に基づき、時間表現に対する日本語と中国語のタグづけ基準を策定した。日本語、中国語の両言語の対訳テキストである小説:「80日間世界一周」に対して時間表現のタグづけを行ない、タグづけ作業を通して作業上の問題点を検討した。この調査を反映し、中国語の統語解析済み新聞記事(Penn Chinese Treebank)に対して、依存構造に基づく時間表現、事象表現のタグづけ手法を提案し、実際にタグづけ作業を行なった。日本語においても同様の作業を行うために、新聞記事に対するタグづけを行うための依存構造解析済みデータを作成した。評価型ワークショップSemEval2007における英語時間表現解析タスクTempEvalに、開発したシステムを参加させた。開発したシステムでは、依存構造解析器の出力を系列ラベリング器に入力することで、好成績(Task Aにおいて2位、Task Bにおいて3位)をおさめることができた。SemEvalのために開発したシステムと、現在作成しているデータを用いて、中国語および日本語の時間表現解析システムの構築に着手した。
すべて 2007 2006
すべて 雑誌論文 (3件) 図書 (1件)
人工知能学会誌 VOl. 22, No. 1
ページ: 69-77
Journal of Chinese Language and Computing Vol. 16, No. 4
ページ: 185-206
知能と情報(日本知能情報ファジィ学会誌) Vol. 18, No. 5
ページ: 669-681