2010 Fiscal Year Annual Research Report
確実性アノテーション:『確実性判断を表す意味的文脈』を記述したコーパスの構築
Project/Area Number |
20500148
|
Research Institution | Tsuda College |
Principal Investigator |
川添 愛 津田塾大学, 女性研究者支援センター, 准教授 (20450166)
|
Co-Investigator(Kenkyū-buntansha) |
戸次 大介 お茶の水女子大学, 大学院・人間文化創成科学研究科, 准教授 (90431783)
片岡 喜代子 九州大学, 大学院・人文科学府, 専門研究員 (80462810)
|
Keywords | 自然言語処理 / アノテーション / 理論言語学 |
Research Abstract |
22年度は、前年度に改訂した「言語情報の確実性に影響する表現およびそのスコープのためのアノテーションガイドライン」に基づき、アノテーション済みコーパスを構築した。同コーパスは、日本語のニュース記事に対し、340種類以上の様相表現、13種類の否定表現、48種類の条件表現とそのスコープをアノテーションしている。また、アノテーション対象テキストの一部は、国立国語研究所の現代日本語書き言葉均衡コーパスのコアデータ(新聞記事)である。アノテーションガイドライン(バージョン2.4、平成23年3月時点での最新版)は、お茶の水女子大学情報科学科のテクニカルレポートとしてWeb上で公開している。 韓国語への応用については、前年度に構築した日本語の表現分類の基準に基づき、韓国語の様相表現の分類を行った。その成果を表した論文は学術誌に採択され、2011年12月に掲載される予定である。 当プロジェクトの概要・成果については、人工知能学会および言語処理学会で発表を行った。言語処理学会では、研究代表者(川添)がテーマセッション「複合辞とモダリティ:理論から応用まで」の共同提案者となり、モダリティに関わる表現および認識手法に関心のある研究者とのディスカッションを行った。また今年度は、話者の態度、信頼性、確実性のアノテーションに関して当プロジェクトと異なるアプローチを採用している研究者グループと連携し、定期的に意見交換をする場を設け、今後の研究協力の可能性を探った。
|
Research Products
(15 results)