研究課題/領域番号 |
07680383
|
研究機関 | 東京農工大学 |
研究代表者 |
小谷 善行 東京農工大学, 工学部, 教授 (20111627)
|
研究分担者 |
野瀬 隆 東京農工大学, 工学部, 助手 (30262231)
乾 伸雄 東京農工大学, 工学部, 助手 (20236384)
|
キーワード | アクセント / 形態素 / 未知語 / コーパス / タグ / 確率 / HMM / 言語獲得 |
研究概要 |
日本語音声対話文においてアクセントを中心とした音声情報を用いて未知語を抽出し、その品詞名や活用などの語彙情報を獲得する研究を計画した。本研究では、日本語の音声対話文のなかから未知語を抽出し、その品詞を始めとする語彙情報を獲得することを目標としている。書かれた文からの未知語情報獲得においては、漢字仮名などの文字種が重要な役割を果たした。音声対話文の場合はそれがまったく無い。逆にアクセント情報および休止(発声の途切れ)情報が加わる。これらの情報をもとにした未知語情報獲得メカニズムを設計した。 システムの具体的目標としては、第一段階として、アクセント付きの文の形態素解析を行ってきたが、さらに、同時に未知語の品詞および活用形(用言なら)を推定る。このことは実験的レベルで試作システムを作成した。本研究は、音声対話の領域での未知語の獲得をめざす点で、今までにない新しい分野である。個々の音素・アクセント素列を入力すれば、それが名詞なのか(さらに漢字熟語なのか)、動詞なのか(そして活用形が何か)等の情報が推論できる。しかしこれを実際的システムとして実現した研究はいままでになかった。そしてこれは、自動的な語彙獲得の研究の一部である。また、人間の言語獲得の認知的研究としても意義がある。具体的には、第一に、アクセント情報を規則として実現し、これを用いて仮名文字文の形態素解析を行うシステムを作成した。さらに、知識獲得の手法として、GMDHネットワークの形態素解析への応用を研究した。また、ベースとなる研究として、隠れマルコフ・モデルによるものを含め、タグなしコーパスからの確率情報獲得とそれを用いた形態素解析、および語や品詞の共起強度の抽出を実現した。また、関連研究として、長音、促音、撥音というモ-ラ形式の研究を行っている。今後、未知語推定メカニズムの認知科学的意味を検討する、すなわち、人間の言語獲得に関する知見を得るという問題に取り組む予定である。
|