研究課題/領域番号 |
09480067
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 神戸松蔭女子学院大学 (1999) 大阪大学 (1997-1998) |
研究代表者 |
郡司 隆男 神戸松蔭女子学院大学, 文学部, 教授 (10158892)
|
研究分担者 |
宮田 高志 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (00283929)
松本 裕治 (松本 祐治) 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
松井 理直 神戸松蔭女子学院大学, 文学部, 講師 (00273714)
橋田 浩一 電子技術総合研究所, 情報科学部, 部長
白井 英俊 中京大学, 情報科学部, 助教授 (10134462)
|
研究期間 (年度) |
1997 – 1999
|
研究課題ステータス |
完了 (1999年度)
|
配分額 *注記 |
14,400千円 (直接経費: 14,400千円)
1999年度: 4,200千円 (直接経費: 4,200千円)
1998年度: 5,200千円 (直接経費: 5,200千円)
1997年度: 5,000千円 (直接経費: 5,000千円)
|
キーワード | 制約に基づく文法 / 連続量 / 最適性 / 辞書 / 電子化コーパス / タグ / 単一化 / 日本語 |
研究概要 |
本研究では、文法記述の中に変形のような派生的な概念を含まない、制約に基づく文法理論を前提にして、日本語の包括的な体系的記述ができるような文法の枠組を設計し、その上に具体的な日本語文法体系を開発するための基盤を築くことを目的とした。 平成9年度から11年度にわたる3年間に以下のことをおこなった。 1.電子化コーパスからの語彙の抽出の自動化 毎日新聞CD-ROMなどの電子化コーパスから、自動わかち書きのツールとして「茶筅」を基にして、その文法規則、辞書記述をそっくり入れ替えることにより、コーパスの中に含まれる単語の一覧を自動的に抽出するシステムを作成した。 2.主な語彙項目の語彙記述とそれに基づくタグ付け 制約に基づく日本語文法で一般に仮定されている素性構造に基づき、名詞、動詞などの範疇に属する主要な語彙項目の語彙情報を網羅的に記述する作業を行なった。その上で、コーパスの個々の利用形態に依存して必要なタグを選定し、汎用の利用形態を仮定した、効果的なタグの形式を検討し、その上でタグ付けを行なった。 3.文法作成支援環境の構築 素性構造編集機能をもったエディターを作成し、GUIの環境による素性構造の変更、結果の確認に役立てた。また、統合的な文法作成システムの中に組み入れて、統語解析をおこなうとともに、前提とする文法システムの問題点を洗い出した。 4.制約変換としての統語解析 音韻的、統語的、意味的な多種の情報の種類と、それらに対する具体的な作業に依存しない一般的な制約処理の手続きを用いる統語解析システムを考案し、タグ付けや対話システムの設計に役立たせた。 5.幼児の言語獲得過程の研究 幼児の動詞の獲得過程のデータを用い、形態的特徴、主語の選択、語順などのあらわれ方を分析した。また、幼児の発話データにタグ付けをおこない、獲得過程の連続的な性質の分析に役立てる試みをおこなった。
|