研究課題/領域番号 |
26284060
|
研究機関 | 青森中央学院大学 |
研究代表者 |
加藤 澄 青森中央学院大学, 経営法学部, 教授 (80311504)
|
研究分担者 |
斉藤 まなぶ 弘前大学, 医学部附属病院, 講師 (40568846)
角岡 賢一 龍谷大学, 経営学部, 教授 (70278505)
中村 和彦 弘前大学, 医学研究科, 教授 (80263911)
飯村 龍一 玉川大学, 経営学部, 教授 (80266246)
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
キーワード | 自閉症スペクトラム障害 / 機能言語学 / コーパス言語学 / 談話分析 / ASD / 臨床言語論 / 言語発達 / 語用論的障害 |
研究実績の概要 |
(1)収集したデータをトランスクリプト化し、1) トランスクリプトのファイル変換 2) 割り込み部分の処理、3) 品詞アノテーション、4) 発話ラベリング、5) SFL(Systemic Functional Linguistics)に基づく語彙-文法資源のうち一部の意味付与のアノテーション、を全件数のうち半数に対して行った。計画では、2018年2月までに、言語分析タグ(日本語形態素と意味レベル)の付与を終え、言語データコーパスを構築する予定であったが、意味レベルの情報タグの付与システムによるタグ付けの精度が想定した範囲よりかなり低い結果となった。システム修正及びシステム構築者と改善の可能性に関して継続的に検討を重ねたが、アノテーション、修正作業、テクストの情報更新と格納を一貫したシステムの中で効率よく行うためのシステムの再構築の必要性が生じた。よって、いったん、古いアノテーション・ツールでの作業を停止し、新たなアノテーション・ツールの開発に着手し、効率性・精緻さの点で、より進歩したアノテーション・ツールの開発のプログラミングのめどを立てた。 (2)アノテーション用の辞書の拡大をはかった。 (3)自閉症スペクトラム障害児/者および定型発達児/者のデータ収集を継続して行い、トランスクリプト化を行うという作業を継続した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
2018年2月までに、言語分析タグ(日本語形態素と意味レベル)の付与を行い、言語データベース(=コーパス)を構築する予定であったが、意味レベルの情報タグの付与システムによるタグ付けの精度が想定した範囲よりかなり低い結果となった。システム修正及びシステム構築者と改善の可能性に関して継続的に検討を重ねたが、タグ付け、修正作業、テクストの情報更新と格納を一貫したシステムの中で効率よく行うためのアノテーション・ツール開発の必要性が生じた。そのためそれまでに終了したアノテーション作業が無効となり、新しく開発したアノテーション・ツールを用いて、再度、アノテーションを一からやり直しすることなったため。
|
今後の研究の推進方策 |
(1)新たなアノテーション・ツールのプログラミング開発のめどがたったので、新しいアノテーション・ツールを用いてのアノテーション作業の再始動となる。新しいアノテーション・ツールは効率性・精緻さにおいて、古いツールとはプログラミング構造の全く異なる画期的なツールとなる見通しである。 (2)コーパス設計を行い、最終的に(1)で意味付与したデータのコーパス格納となる。 (3)自閉症スペクトラム障害のグループと定型発達グループのデータを、コーパスに格納とし、コーパスより得られたデータを基に、両グループの比較対象を行い、最終的に自閉症スペクトラム障害の言語使用を、包括的・体系的見地からまとめる。
|
次年度使用額が生じた理由 |
旧式プログラミングによるアノテーションを途中半ばで無効とし、新しいアノテーション・ツールの開発期間中、アノテーション作業を一時的に停止せざるをえなくなり、当初予定していたマンパワーへの謝金支払いの持越しとなったことが原因である。次年度、新たにゼロからのアノテーション作業の開始となるが、旧式のツールによるアノテーション作業分が無効となった分、マンパワーへの謝金支払いに二重に費用がかかることになった。
|