研究課題/領域番号 |
08J09545
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
言語学
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
小町 守 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2008 – 2009
|
研究課題ステータス |
完了 (2009年度)
|
配分額 *注記 |
1,000千円 (直接経費: 1,000千円)
2009年度: 500千円 (直接経費: 500千円)
2008年度: 500千円 (直接経費: 500千円)
|
キーワード | 自然言語処理 / 機械学習 / コーパス / 大規模データ / 半教師あり学習 / ブートストラッピング法 / 国際研究者交流 / アメリカ / 項構造解析 / かな漢字変換 |
研究概要 |
本年度は、本研究のベースとなった事態性名詞の述語項構造解析の研究に関して、構文パターンと既存の項構造解析モデルを組み合わせた手法をまとめた論文が出版された。しかしながら、年次計画1年目の後半に予定していた大規模なコーパスからリソースを自動構築する研究が理論面においても実践面においても発展を見せ、研究計画を変更したために、本研究の2年度目に予定していた名詞句の自動項構造解析は実施しなかった。以下では研究計画を変更したあとの研究について述べる。 本年度の研究上の貢献は2つある。1つ目は、1年度目においてグラフ理論に基づく自然言語処理における半教師あり手法(ブートストラッピング)について行った研究をまとめ、発表したことである。グラフ理論的観点からブートストラッピングを解析した研究はこれまでになく、ブートストラッピングに内在する問題点を理論的に明らかにした一方、リンク解析で用いられている手法を自然言語処理にも適用し、語義曖昧性解消のタスクで高い性能が得られることを示した。さまざまなヒューリスティックを用いるブートストラッピングと比較して、使用時に決めなければならない変数の数が少ないため、扱いが容易であることも提案手法の利点の一つである。 2つ目は、ヤフー研究所との共同研究により、検索クリックスルーログをコーパスとした意味カテゴリ辞書の自動構築の研究を行い、検索クリックスルーログが意味カテゴリの獲得に有用な情報抽出源であることを示した。また、日本最大規模のウェブデータを対象として、並列分散環境でも実行できるようなスケーラブルなアルゴリズムを提案し、有効性を示した。 また、本年度は年次計画で予定していた統計的機械翻訳への応用に替え、3ヶ月アメリカ合衆国Apple Inc.に渡航し、統計的自然言語処理(統計的かな漢字変換)に関する研究を行った。
|