研究課題/領域番号 |
26284084
|
研究機関 | 立命館大学 |
研究代表者 |
田中 省作 立命館大学, 文学部, 教授 (00325549)
|
研究分担者 |
徳見 道夫 九州大学, 言語文化研究科(研究院), 名誉教授 (90099755)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 構文木 / 構文変化 / 学術英語 / プログラミング |
研究実績の概要 |
今年度は,主に次のようなテーマを重点的に推進した. 1. 英語科学論文執筆の手引きからの校正英文対の整備:本年度は次項に述べる校正前後の構文構造上の変化(構文変化)を同定する技術を完成させるため,英語科学論文執筆のいわゆる手引きに掲載されている校正前後の例文を約5千対強蓄積した.これらのデータに対して次項の技術開発に基づいた構文変化情報を付し,例文が再構成できないような形で研究目的に限り公開することを予定している. 2. 校正前後の構文変化を同定する技術の開発:前年度からの継続課題であり,前年度の成果を引き継ぎつつ,検出技術を構成した.具体的には構文変化を3組の情報 <C, D, A> として与え(それぞれ,Cは校正前後で不変の構造の列,Dは校正前から除かれる構造の列,Aは校正後に加えられる構造の列),これらを校正前後の構文木から実時間で同定する. 3. 構文木を配列で扱う方式の提案:本項目は副次的な成果である.木構造は,一般的なプログラミングでは構造体やポインタ,条件分岐,再帰的手続き,必要に応じて動的メモリ管理で実装することが多い.一方,コーパス研究者の多くはプログラミング等にさほど精通していない現状がある.本課題では,コーパス研究者が木構造に対する特異な処理も含め,各自で取り扱いができるよう,木構造とその処理を配列と繰り返し,条件分岐のみで実装した.このこと自体は情報学的な新規性はないものの,多くのコーパス研究者にとって木構造の取り扱いが格段に身近となる.同方式による木構造のための基礎的なライブラリ等を整備しており,次年度複数のプログラミング言語を想定した形で公開する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本課題に直接かかわる成果発表の遅れと,同定された構文変化の分析が未達である.
|
今後の研究の推進方策 |
少量ながら基本データと要素技術は整備が進んでおり,次年度は構文変化の分析と成果発表に専念する.
|
次年度使用額が生じた理由 |
校正英文対のソースを実テキストから手引きの例文に切り替えたことによる,校正に関する謝金の未使用が主たる理由である.
|
次年度使用額の使用計画 |
校正英文対の充実,作成したデータ公開の支援に関わる謝金,成果発表に関わる費用に集中的に充てる予定である.
|
備考 |
1. 第8回異分野融合テキストマイニング研究会(2017年3月5日・九州大学(福岡県福岡市))第I部指定討論者
|