1996 Fiscal Year Annual Research Report
Project/Area Number |
07680383
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
小谷 善行 東京農工大学, 工学部, 教授 (20111627)
|
Co-Investigator(Kenkyū-buntansha) |
野瀬 隆 東京農工大学, 工学部, 助手 (30262231)
乾 伸雄 東京農工大学, 工学部, 助手 (20236384)
|
Keywords | アクセント / 形態素 / 未知語 / コーパス / タグ / 確率 / HMM / 言語獲得 |
Research Abstract |
日本語音声対話文においてアクセントを中心とした音声情報を用いて未知語を抽出し、その品詞名や活用などの語彙情報を獲得する研究を計画した。本研究では、日本語の音声対話文のなかから未知語を抽出し、その品詞を始めとする語彙情報を獲得することを目標としている。書かれた文からの未知語情報獲得においては、漢字仮名などの文字種が重要な役割を果たした。音声対話文の場合はそれがまったく無い。逆にアクセント情報および休止(発声の途切れ)情報が加わる。これらの情報をもとにした未知語情報獲得メカニズムを設計した。 システムの具体的目標としては、第一段階として、アクセント付きの文の形態素解析を行ってきたが、さらに、同時に未知語の品詞および活用形(用言なら)を推定る。このことは実験的レベルで試作システムを作成した。本研究は、音声対話の領域での未知語の獲得をめざす点で、今までにない新しい分野である。個々の音素・アクセント素列を入力すれば、それが名詞なのか(さらに漢字熟語なのか)、動詞なのか(そして活用形が何か)等の情報が推論できる。しかしこれを実際的システムとして実現した研究はいままでになかった。そしてこれは、自動的な語彙獲得の研究の一部である。また、人間の言語獲得の認知的研究としても意義がある。具体的には、第一に、アクセント情報を規則として実現し、これを用いて仮名文字文の形態素解析を行うシステムを作成した。さらに、知識獲得の手法として、GMDHネットワークの形態素解析への応用を研究した。また、ベースとなる研究として、隠れマルコフ・モデルによるものを含め、タグなしコーパスからの確率情報獲得とそれを用いた形態素解析、および語や品詞の共起強度の抽出を実現した。また、関連研究として、長音、促音、撥音というモ-ラ形式の研究を行っている。今後、未知語推定メカニズムの認知科学的意味を検討する、すなわち、人間の言語獲得に関する知見を得るという問題に取り組む予定である。
|
Research Products
(6 results)
-
[Publications] 重泉有希: "語のつながりのアクセント規則を用いた仮名文字文の形態素解析" 情報処理学会全国大会講演論文集. 52. 2-171-2-172 (1996)
-
[Publications] 藤本浩司: "GMDHニューラルネットワークの形態素解析への適用" 情報処理学会全国大会講演論文集. 52. 3-79-3-80 (1996)
-
[Publications] 鈴木由里: "タグなしコーパスからの確率情報の段階的学習と形態素解析への応用" 言語処理学会年次大会発表論文集. 2. 65-68 (1996)
-
[Publications] 中川賢一郎: "ニューラルネットワークを用いたコーパスからの共起強度の抽出" 情報処理学会研究報告. 96-NL-113. 31-36 (1996)
-
[Publications] 木村健: "HMM形態素解析システムにおける確率情報の獲得" 情報処理学会全国大会講演論文集. 54. 2-49-2-50 (1997)
-
[Publications] 赤地透: "長音・促音・撥音に着目した音価生成" 情報処理学会全国大会講演論文集. 54. 2-261-2-262 (1997)