研究領域 | 代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備 |
研究課題/領域番号 |
18061005
|
研究種目 |
特定領域研究
|
配分区分 | 補助金 |
審査区分 |
人文・社会系
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
|
研究分担者 |
徳永 健伸 東京工業大学, 大学院・情報理工学研究科, 教授 (20197875)
乾 健太郎 東北大学, 大学院・情報科学研究科, 教授 (60272689)
橋田 浩一 独立行政法人産業技術総合研究所, サービス工学研究センター, 次長 (00357766)
浅原 正幸 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80379528)
橋本 泰一 東京工業大学, 総合プロジェクト支援センター, 特任准教授 (10345382)
小町 守 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (60581329)
|
研究期間 (年度) |
2006 – 2010
|
研究課題ステータス |
完了 (2010年度)
|
配分額 *注記 |
91,700千円 (直接経費: 91,700千円)
2010年度: 18,800千円 (直接経費: 18,800千円)
2009年度: 20,000千円 (直接経費: 20,000千円)
2008年度: 21,200千円 (直接経費: 21,200千円)
2007年度: 19,700千円 (直接経費: 19,700千円)
2006年度: 12,000千円 (直接経費: 12,000千円)
|
キーワード | コーパス / 形態素解析 / 統語解析 / 述語項構造解析 / アノテーション / 自然言語解析 / 照応解析 / 固有表現認識 / 機械学習 / 談話解析 / 言語解析 / 自然言語処理 / 言語学 / 文書解析 / 日本語処理 |
研究概要 |
日本語コーパスに対する様々な言語情報のアノテーションを自動的に行う言語解析ツールの開発,および,アノテーションの誤り修正やアノテーションを施されたコーパスの柔軟な利用や管理を行うためのコーパスツールの開発を行った.具体的には,形態素解析,係り受け解析,並列構造解析,固有表現認識,述語項構造解析,照応・共参照解析,事象間時間関係解析などの自動解析,および,これらのアノテーションを施したコーパスを構築した.
|