1997 Fiscal Year Annual Research Report
談話研究のための談話データの電子化の標準化と解析ツールの開発
Project/Area Number |
09834009
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Chukyo University |
Principal Investigator |
白井 英俊 中京大学, 情報科学部, 助教授 (10134462)
|
Co-Investigator(Kenkyū-buntansha) |
宮田 Susanne 愛知淑徳短期大学, コミュニケーション学科, 助教授 (40239413)
中 則夫 大阪学院大学, 国際学部, 講師 (70278555)
杉浦 正利 名古屋大学, 言語文化部, 助教授 (80216308)
|
Keywords | 談話研究 / 談話データベース / 談話データの標準化 / 談話データの電子化 / 解析ツール / 談話のタグセット |
Research Abstract |
本研究は談話データを電子化するための標準化を研究目的としたものであり、 1.言語習得研究において重要と考えられる言語・非言語的要素の同定、 2.談話データの分析尺度やタグセットの検討、 3.日本語の書き起こしデータの支援ツールの有効性の確認と発展、 4.言語データの電子化の手法の検討、 について研究を進めた。 (1)については、発話の認定に関わる問題(日本語特有の相づちと挨拶などの扱い)の解決案を提示し、また言語外情報を主題とする研究におけるコード化や検索の問題点を特定した。(2)については、特に中と宮田が発達心理学会などにおけるワークショップを企画し、日本語用の平均発話長測定法(MLU)の問題点と統一的な尺度の提案を行った。(3)については特に白井が、日本語の漢字かな混じりで書かれた書き起こしデータを既存の発話データ解析ツールで分析するためのインタフェースを開発し、今までに20人ほどの研究者に使用してもらい、そのインタフェースの性能の評価と改良を行った。このインタフェースには、京大で開発された日本語の形態素解析を利用した物であるが、これは一般の文書を対象としたものであるため、このような用途で用いる際の問題点が明らかになった。(4)については特に杉浦が、CHATフォーマットのSGML化を検討し、タグ自体をDTDで定義することにより、変換の可能性を確認するとともに、SGMLに従いながらも、HTMLの持つWeb上での電子データの利用という特長を生かした規格XMLによる発話データの記述方法を検討した。
|
Research Products
(7 results)
-
[Publications] 白井英俊: "連体修飾節の意味構造と獲得について" 日本認知科学会 第14回全国大会発表論文集. (1997)
-
[Publications] 杉浦正利: "Java-Based Authoring Tools (J-BAT) for Language Learning" The Proceeding of the Computer Assisted Language Instruction Consortium. (1997)
-
[Publications] 宮田 Susanne, 中則夫: "Noun and verbs in early vocabulary development of Japanese Children" 大阪学院大学 国際論集. 8-2. 1-19
-
[Publications] 中 則夫: "形態素結合の発達からみた文法発達におけるMLUの意味" 発達心理学会 第9回大会発表論文集. (1998)
-
[Publications] 宮田 Susanne: "日本語におけるMLU測定法について" 発達心理学会 第9回大会発表論文集. (1998)
-
[Publications] 中 則夫: "心的動詞の使用-野地データのCHILDES/JCHATによる検索-" 発達心理学会 第9回大会発表論文集. (1998)
-
[Publications] 白井 英俊: "Topics in Constraint-Based Grammar of Japanese (Gunji T.and Hashida K.(Eds))" Kluwer Academic Publisher, 264 (1998)