2001 Fiscal Year Annual Research Report
実例・学習者両コーパスを利用した科学系英文論文の複数文関の連携に関する研究
Project/Area Number |
13710281
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Research Institution | Osaka Women's University |
Principal Investigator |
橋本 喜代太 大阪女子大学, 人文社会学部, 講師 (50278818)
|
Keywords | 科学英語 / 論文作成 / 結束性 / パラグラフ構成 / 情報構造 |
Research Abstract |
今年度は主に分析対象となるデータの収集・整理を中心とした作業を行なった。科学英文論文としては、バイオサイエンス系のもの並びに物性科学系のものを中心とし、データ量として6GB(テキストデータに変換して約2GB)の収集を終え、そのすべてをセクション別に分類している。学習者データベースとしては本研究者が関わっている奈良先端科学技術大学院大学の修士課程学生の答案を中心としたデータ構築をOCR等を利用しつつ整理した。 こうしたデータの分析に当たって本研究では形態素解析プログラムを用いるため、その実装として奈良先端科学技術大学院大学で開発途上のechasenの辞書データベースの整備に併せて着手している。特に科学英文論文を扱うため大量の専門用語の登録が必要であり、上記で構築したデータの一部を入力として登録を進めている。この作業をある程度自動化することによって他分野の用語も簡便に登録が可能なようにする手法を検討中である。 また、既に整備が完了したデータなどをもとに文間連携の単位の一つであるパラグラフの構造を分析し、いわゆるトピックセンテンスの設定自体に諚義のあることを論文として発表した。むしろ、パラグラフ冒頭付近の提題文を定義し、その上でパラグラフの他部分の各文がどのように働いているかを検討する必要性を示している。
|