研究課題/領域番号 |
09834009
|
研究種目 |
基盤研究(C)
|
研究機関 | 中京大学 |
研究代表者 |
白井 英俊 中京大学, 情報科学部, 助教授 (10134462)
|
研究分担者 |
宮田 Susanne 愛知淑徳短期大学, コミュニケーション学科, 助教授 (40239413)
中 則夫 大阪学院大学, 国際学部, 講師 (70278555)
杉浦 正利 名古屋大学, 言語文化部, 助教授 (80216308)
|
キーワード | 談話研究 / 談話データベース / 談話データの標準化 / 談話データの電子化 / 解析ツール / 談話のタグセット |
研究概要 |
本研究は談話データを電子化するための標準化を研究目的としたものであり、 1.言語習得研究において重要と考えられる言語・非言語的要素の同定、 2.談話データの分析尺度やタグセットの検討、 3.日本語の書き起こしデータの支援ツールの有効性の確認と発展、 4.言語データの電子化の手法の検討、 について研究を進めた。 (1)については、発話の認定に関わる問題(日本語特有の相づちと挨拶などの扱い)の解決案を提示し、また言語外情報を主題とする研究におけるコード化や検索の問題点を特定した。(2)については、特に中と宮田が発達心理学会などにおけるワークショップを企画し、日本語用の平均発話長測定法(MLU)の問題点と統一的な尺度の提案を行った。(3)については特に白井が、日本語の漢字かな混じりで書かれた書き起こしデータを既存の発話データ解析ツールで分析するためのインタフェースを開発し、今までに20人ほどの研究者に使用してもらい、そのインタフェースの性能の評価と改良を行った。このインタフェースには、京大で開発された日本語の形態素解析を利用した物であるが、これは一般の文書を対象としたものであるため、このような用途で用いる際の問題点が明らかになった。(4)については特に杉浦が、CHATフォーマットのSGML化を検討し、タグ自体をDTDで定義することにより、変換の可能性を確認するとともに、SGMLに従いながらも、HTMLの持つWeb上での電子データの利用という特長を生かした規格XMLによる発話データの記述方法を検討した。
|