研究課題/領域番号 |
23652113
|
研究機関 | 東京大学 |
研究代表者 |
古市 由美子 東京大学, 工学(系)研究科(研究院), 講師 (60422341)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 話ことばコーパス / 理工学系専門語彙 / 理工学系語彙用例集 / web教材 |
研究概要 |
本研究グループは、理工学系留学生の研究生活における日本語使用実態の解明を目指し2007年より理工学系研究室のゼミ内の日本語による発表、質疑応答を含む自然発話を音声データ化し、文字化した話し言葉コーパスを構築している。すでに工学系の4分野において約80時間収録し、延べ語数1,177,834が得られており、新たな4分野(社会基盤、産業機械、化学システム、情報理工)のデータを収集中である。現在、これらのデータを基にした教材開発の一環として、学習語彙用例集を作成している。当学習語彙用例集は将来的にネットワークを通じて提供するweb教材にすることを視野に入れながら作成されており、研究室内でのゼミ発表やディスカッション内容を聞き取り、理解し、さらに話すことができるようになる自律学習ツールを目指している。次に当学習語彙用例集の作成過程について説明する。まず、コーパスの分析から語彙の出現頻度を調査した。この結果、名詞語彙が多く、専門分野によって出現する名詞の分布に特徴があることがわかった。これをうけ、現在コーパスの名詞語彙を含んだ文例の用例選定と整形作業を、理工学系専門家及び日本語教師による学習優先度の観点に基づいて行っている。さらに、単語の理解にとどまらず、産出のヒントを得られるようにこれらの語彙がどのような文脈で使用されているか、またどのような言葉と共に出現するかを調査し、学習項目の枠組みを設計した。また、23年度は東京大学工学系に日本語教室において当研究チームが構築している「理工学系話し言葉コーパス」のデータを素材とする「専門語彙・漢字」クラスを新たに設け、授業実践も行った。これらの授業実践で得られた成果をもとに、今後の当該コーパスおよび学習語彙用例集作成の方針を検討していく予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
学習語彙用例集のための基礎資料の充実を図り、量的及び質的なアプローチを用い、基本的な分析の枠組みの確立を目指しており、当該学習語彙用例集の枠組みの一つである「学習項目」の定義および選定を、当研究チームと理工学系分野の専門家との間で協議しながら進めている。23年度は都市環境分野の専門家と連携して、「学習語彙用例集(都市環境分野)」の試用版を作成した。現在、都市環境分野に所属する日本語母語話者の学生、日本語学習者にモニターとして当該学習語彙用例集の試用を依頼している。このように、理工学系研究分野の有識者や当該分野に所属する日本語母語話者の学生、日本語学習者も当研究チームが作成するコーパスおよび学習語彙用例集に高い関心を示している。さらに当研究チームと理工学系研究分野の人々との間に築かれた信頼関係によって、研究がスムーズに進められていると考える。
|
今後の研究の推進方策 |
平成24年度コーパスから取り出した情報を、どのようにして正確であると同時に親切でわかりやすい解説に書き換えてゆくかという問題を念頭に置き、学習語彙用例集の作成に引き続き取り組む。本用例学習辞典は「語彙部」と「談話・表現部」の2部を柱とする。「語彙部」では、分野別に学習重要度の高い専門名詞およびアカデミックな場面において学習優先度の高い動詞の提示のほか、専門語彙を中心とするコロケーションの提示及び解説を行う。「談話・表現部」は、研究内容に関する発話の理解を促進し、自らの考えを発信するための談話表現の解説を中心とする。前年度で確定された基本的な分析の枠組みをさらに精度を上げて用い、アカデミックな場面において多分野に跨って広く使われ、全分野共通で最も基本的な語彙・表現を抽出し、特定すると同時に、分野別の基本的な語彙・表現を抽出・特定する。各分野において使用頻度が高く、学習重要度の高い専門語彙の認定を該当分野の専門家に評価を依頼する。前年度の都市環境分野に引き続き、他の分野の専門家に協力を要請しながら、試用版の拡充を進め、試用版のモニターも同時に行っていく。平成25年度理工学系の複数分野の学習語彙用例集の試作版を完成し、オンライン公開を試みる。具体的には、前年度の結果を整理し、話し言葉の特徴が出ている表現も積極的に取り入れ、音声的な情報を付与し、学習語彙用例集の試作版を完成する。学習者の利便性を図るため、基本語彙及び専門語彙の英訳を提供するほか、学習者の出身地を考慮し、中国語、韓国語、タイ語の対訳も提供する。用例の理解を高めるために、英訳版の作成も検討する。試作版の完成とともに、学習者の自律学習を促進し、インターネットを通じて国内外の関連機関や専門日本語教育関係者との言語資源の共有と利用結果のフィードバックが実現できるよう、試作版をオンラインで公開することを試みる。
|
次年度の研究費の使用計画 |
システム運営費:サーバーレンタル代(シンタックス)150千円 謝金:専門家による助言8分野×2時間×@7500 120千円 文字起こし1分野×200千円200千円 国内学会旅費1人×50千円50千円 海外旅費:成果発表 韓国学会発表(韓国)1人×100千円100千円 翻訳料100千円 データ整理1人×15千円30千円 計750千円
|