研究分担者 |
徳永 健伸 東京工業大学, 大学院・情報理工学, 助教授 (20197875)
乾 健太郎 奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (60272689)
橋田 浩一 独立行政法人産業技術研究所, 情報技術研究部門, 副研究部門長 (00357766)
橋本 泰一 東京工業大学, 統合研究院ソリューション研究機構イノベーションシステム研究センター, 特任助教授 (10345382)
浅原 正幸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80379528)
|
研究概要 |
本年度の主な活動と成果は,「次の通り「である. これまで開発してきたコーパス検索ツール茶器を拡張し,複合語の取り扱いと複合語の構成要素を表示する機能の追加を行なった.また,今後他のシステムとのデータ共有の利便性を考え,形態素解析・係り受け解析済みコーパスのためのデータベーススキーマの整理を行った.さらに,新しい分野の文書の解析精度を高めるために未知語処理を考慮した頑健な形態素解析法の設計を行なった.様々な分かち書き基準に対応するため,確率的単語分割ツールの設計と実装を行なった.機械学習に基づぐ照応解析システムの洗練,および,述語項構造解析システムの設計と実装を行なった.また.これらのシステムの学習・評価データとして,NAISTテキストコーパスを構築し,一般公開した.さらに,セグメントとリンクに基づく汎用タグ付けツールaTagrinの設計を行い,プロトタイブシステムを作成した.コーパスには様々な種類のアノテーションが行なわれる可能性があるが,そのほとんどは文書の特定のセグメントに対するラベル付け,あるいは,セグメント間の関係を表すリンクのいずれかに分類するととができる.aTagrinでは,セグメントとリンクのデータフォーマットを定義し,特に,リンクについてはソースセグメント,ターゲットセグメント,リンクの名称以外にリンクに方向性があるか,また,関係が遷移的かどうかを記述することができるようにし,リンクの意味が明確になるようにした. Webベースのコーパス検索ツールの構築と.コーパス内の単語の共起分析のためのグラフ表示モジュールの作成を行なった. これまで構築してきたセマンティクエディタを,拡張RDFによる言語的構造の一般的表現と可視化が行なえるように拡張し,照応や共参照を含む談話構造の表示・編集ツールを構築した.
|