研究課題/領域番号 |
19530773
|
研究機関 | 東北大学 |
研究代表者 |
岡田 毅 東北大学, 大学院・国際文化研究科, 教授 (30185441)
|
研究分担者 |
坂本 泰伸 東北学院大学, 教養学部, 准教授 (60350328)
|
キーワード | データベース / 分散処理 / ネットワーク / コーパス / 英語構文 / 動詞活用形 / EFL教材作成 |
研究概要 |
今年度から運用を開始した研究代表者・研究分担者間のVPNによる連携ネットワークにはセキュリティ上の配慮を怠らず、EFL教材作成のための解析対象となるデータベースを、統一したフォーマットの下で構築するための基本的アルゴリズムを確立した。単にコーパスの量的な増加だけを目指すような方向を取るのではなく、それに付加するべき情報の質と種類を体系的に研究した。そのためには、既存の多くの英語母語話者コーパスなど)のデータ構造を精密に検証した。これらの多くはXML形式で記述されているが、バックボーンとしてのデータベース構造を整備しない限り、表層的な処理の限界がある。初期の解析で得られた結果を次段階の解析のキーとするためには、Webシステム上でのプロセス管理の問題が大きな障害となるが、この問題のデータベース構造の整備と統一及び付加情報の充実といった手法での克服を目指した。XML形式以外によるデータの記述に関しては、本研究で開発する英語教科書のマルチメディアコーパスの中に、教科書の当該頁の画像のみならず、音声や動画情報への関連付けを実装することの検討も行った。特に中学校の低学年の導入部分で用いられる慣用句や簡単な構文を用いた英語による挨拶などの初歩的表現等に関しては、独自に動画を撮影・編集し、日常表現に伴う母語話者の身振りや顔の表情といった非言語情報を的確に日本人学習者に伝えるための効果的な手段としてマルチメディア化したデータベースが注目される。岡田が東北大学大学院国際文化研究科文化研究科において担当している「マルチメディア運用論」の講義等においても研究の中間成果を題材として取り上げ、大学院の教育研究に供した。加えて3月中旬に東北大学において「コーパス研究に関する勉強会」を主催し、taggingの問題とRDBMSについての討論を重ねた。
|