2006 Fiscal Year Annual Research Report
Project/Area Number |
18700146
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
浅原 正幸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80379528)
|
Keywords | 自然言語処理 / 知識処理 / 言語解析 / オントロジー / 時相論理 |
Research Abstract |
英語で採用されているTimeML1.2に基づき、時間表現に対する日本語と中国語のタグづけ基準を策定した。日本語、中国語の両言語の対訳テキストである小説:「80日間世界一周」に対して時間表現のタグづけを行ない、タグづけ作業を通して作業上の問題点を検討した。 この調査を反映し、中国語の統語解析済み新聞記事(Penn Chinese Treebank)に対して、依存構造に基づく時間表現、事象表現のタグづけ手法を提案し、実際にタグづけ作業を行なった。 日本語においても同様の作業を行うために、新聞記事に対するタグづけを行うための依存構造解析済みデータを作成した。 評価型ワークショップSemEval2007における英語時間表現解析タスクTempEvalに、開発したシステムを参加させた。開発したシステムでは、依存構造解析器の出力を系列ラベリング器に入力することで、好成績(Task Aにおいて2位、Task Bにおいて3位)をおさめることができた。SemEvalのために開発したシステムと、現在作成しているデータを用いて、中国語および日本語の時間表現解析システムの構築に着手した。
|