2002 Fiscal Year Annual Research Report
Project/Area Number |
13710309
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
高木 一広 九州工業大学, 情報工学部, 助教授 (20295009)
|
Keywords | 日本語文末表現 / 自然言語処理 / 省略 / 電子コミュニケーション / 文体 / 大規模データ |
Research Abstract |
日本語研究においては、早くから日本語の文末表現がコミュニケーションで果たす役割について様々な形で議論され、膨大な研究の蓄積がある.一方で日本語を対象とした自然言語処理においては、文末表現は一般に真っ先に切り捨てられてしまい、その情報が積極的に活用されることはあまりない. 本研究では、実際のコミュニケーションの一例として、ネットニュースの対話対(ある投稿に対するリプライの対)をデータベース化し、それらの対話対において文末表現として利用される表現のバリエーション・頻度の調査を行った その結果 (1)ネットニュースに現れる文末表現は非常に固定的である(2)終助詞は多く用いられるものの助動詞の数はあまり用いられない(3)名詞止め、連用止めなど省略の多用などが特徴であることが分った。 このような電子コミュニケーションの特徴と、多くの自然言語処理システムがこのようなデータを利用していることを併せると、今後の日本語研究の方向性の一つとして、これらの新しい文体・表現に対応していくことが必要になる。
|