1998 Fiscal Year Annual Research Report
大規模コーパスから日本語表現の構造知識を自動獲得するためのプログラムの研究開発
Project/Area Number |
09558035
|
Research Institution | Tottori University |
Principal Investigator |
池原 悟 鳥取大学, 工学部, 教授 (70283968)
|
Co-Investigator(Kenkyū-buntansha) |
白井 諭 NTTコミュニケーション科学研究所, 主幹研究員
|
Keywords | コーパス / 構造知識 / 知識獲得 / 自動学習 / 共起表現 |
Research Abstract |
昨年度は、言語データベースを作成した後、各種の表現規則抽出の方法を検討したが、本年度は、より汎用的な日本語表現の意味辞書作成を目指して、表現抽出プログラムの基本試作を行なった。また、そのプログラムを言語データベースに適用して、表現抽出のために実験を行った。 1. 連鎖型/離散型共起表現抽出プログラムの基本試作 連鎖型/離散型共起表現抽出基本機能、字種制限、特定品詞、単語文法属性に着目した抽出制御機能を実現し、形態素解析プログラムALT-JAWSとの結合実験ができるようにした。 2. 共起表現抽出実験 機械翻訳用表現意味辞書作成に使用する観点から、原文の単語置き換え機能を駆使して、以下の3種類の実験的検討を行った。 (1) 動詞と名詞から構成される表現(単文相当)の抽出 (2) 複数の動詞を含む表現(複文・重文に相当)の抽出 (3) 複数の名詞を含む表現(名詞句に相当)の抽出 これらの結果、目的に合わせた単語置き換えを行うことで、抽出されるゴミの割合は大幅に減少し、人手作業が可能なデータが得られる見込みとなった。
|
-
[Publications] 春野雅彦: "Two-step Extraction of Bilingual Collocations by Word-Level Sorting" ICEIC Transactions. w8L_D・10号. 1103-1110 (1998)
-
[Publications] 荒木哲朗: "N-gramを用いた対話文の言い直し表現の検出法" 言語処理学会論文誌. 6巻・3号.
-
[Publications] 木本泰博: "日本文意味解析に必要な最小意味属性の組の決定" 情報処理学会57回全国大会. 3V巻・06号. (1998)
-
[Publications] 池原 悟: "自然言語処理の基本問題と意味辞書の役割" 信学会NLCシンポジューム. (1999)
-
[Publications] 市原 創: "要素の順序関係から見た類似文最適照合検索" 第5回言語処理学会年次大会. (1999)
-
[Publications] 中井慎司: "階層構造を持つ属性の組とクラスで与えられる構造規則のクラス分類" 第5回言語処理学会年次大会. (1999)