2011 Fiscal Year Research-status Report
日本人科学研究者向け英語学術論文執筆支援用教材システムの開発
Project/Area Number |
23531238
|
Research Institution | Tohoku University |
Principal Investigator |
岡田 毅 東北大学, 国際文化研究科, 教授 (30185441)
|
Co-Investigator(Kenkyū-buntansha) |
坂本 泰伸 東北学院大学, 教養学部, 准教授 (60350328)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | コーパス / データベース / 教材作成 / 英語学術論文 |
Research Abstract |
研究期間初年次にあたる今年度は、世界水準で発信すべき学術コンテンツを持つ日本人科学研究者が英語科学論文を正確に量産するために効果的な教材を作成するために必要な汎用的コーパス解析システムの全体像を各方面からの検討を加えることによって慎重に設計した。 システムの中核を成すRDBMS(Relational Database Managament System)の基本的な構築を、研究分担者との連携により概ね完成させ、その成果を2011年9月1日-3日に英国Bristol市のUniversitu of West of Englandで開催された第44回英国応用言語学会での研究発表に繋げた。また国内学会では情報処理学会での研究発表を行った。 平成23年8月7日には、立命館大学田中省作准教授、静岡大学宮崎佳典准教授、京都大学大学院博士課程鈴木大介氏を仙台市泉区の東北学院大学泉キャンパスに招待し、(1)コーパス処理全般に係る著作権処理の問題、(2)日本人ユーザーの入力英文のベクトル解析に準拠した評価と修正候補英文の専用コーパスからの抽出と提示、等に係る研究会を実施した。これにより、既存大規模コーパスの処理とは別に、個々の研究者が独自に開発するコーパス構築に関わる著作権処理の過程を明らかにすることができた。また、日本人ユーザーの入力英文との類似性を算出したうえで、準拠すべき母語話者産出の英文をモデルとして提示するというシステムを、語彙とその連語(collocation)、連辞(colligation)のレベルで精密化できれば、特定英語ジャーナルという限定された言語使用域(register)なり、学術共同体(academic community)に最も受容されやすい表現や文体を伴ったモデル英文を検索して教材として提供するというシステムの目的に合致するということも明らかになった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
国内外の学会での研究発表や研究会と並行して、研究代表者と分担者は概ね毎月1回のペースで定例の打ち合わせ会を実施し、研究の進捗状況を確認するとともに新たに確定できた具体的な課題の整理と解決に向けての方向性を共有している。また、RDBへの入力ソースを整備するための基幹システムとしての行整形プログラム(Line Formatter)をJavaによるDCL(Dynamic Class Loading)の機能を活用し、処理対象となる英文データの生成および入手過程に応じた処理フィルタの選択と配置をGUI(Graphic User Interface)を介して柔軟に実現できる段階にまでの開発を達成した。 システムユーザーとして想定している日本人科学者にとって、自らの産出した英文の読み易さ(readabikity)の度合いは極めて重要な勝因であり、その度合いの測定に際して、従来から提唱されているFlesch Readability Score, Flesch Reading Ease Score, Flesch-Kincaid Grade Level, Gunning's Fog Index, SMOG Formula, FORECAST Readability Formula, Powers-Summer-Kearl Formulaなどの公式に加えて、JACET8000レベルのような日本人にとっての語彙的難度を加味した新しい要因を計算式に導入するというアイディアが生まれている。
|
Strategy for Future Research Activity |
研究期間の2年目となる平成24年度には、これまでに開発したパイロットシステムの実践的な試験稼働を企図し、そこからより精緻なシステム設計の示唆を得る。具体的には、例えばTOEFL等の英語技能テストで用いられている大量の英文データをRDBに格納し、それらに対して必要な属性をGUIを介して付与し、科学論文作成支援にとって必要なユーザーディマンドの明確な把握を目指す。 これと並行してドイツHamburg大学で開発されたコーパス属性付与システムCATMA(Computer Assisted Text Markup and Analysis)の機能を、徹底的に分析することによって、実践的な属性付与のあり方を根本的に探究する。 また、CHILDES(Child Language Data Exchange System)に代表されるような世界規模のデータ収集・共有システムの利点を最大限に取り入れた汎用性を保証する拡張性のあるデータベースシステムの在り方についての検討を推進する。この場合、第二言語習得や児童英語の修得過程を分析する多くの研究者の知見を参考にしながら、コーパスが具備すべき属性(attribution)の種類とその構造化という極めて重要な問題を追及する。
|
Expenditure Plans for the Next FY Research Funding |
システムの試験稼働に必要なコンピュータ外部記憶装置を充実させる。試験的システム発信用の小規模ワークステーション、および一次データ収取とその整備に不可欠なパーソナルコンピュータを導入する。試験的RDMBS構築とその性能評価のためのソフトウェアを購入する。 国内外の研究者・研究機関を訪問しての研究資料閲覧および収集のため、および研究成果発表のための国内外旅費を計上する。
|