研究課題/領域番号 |
24520655
|
研究種目 |
基盤研究(C)
|
研究機関 | 東京理科大学 |
研究代表者 |
清水 眞 東京理科大学, 理学部, 教授 (50187465)
|
研究分担者 |
村田 真樹 鳥取大学, 工学(系)研究科(研究院), 教授 (50358884)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 学術目的の英語 / コロケーション / パターン / コーパス / 能動態と目的語 / 受動態と主語 / 物理化学と化学 / 自動抽出 |
研究概要 |
研究実施計画において10本コーパスの編纂を行うという計画を立てていたが、計画通り10本のコーパスを編纂できた。最終目的の30本中1/3の目的が達せられた。ただし、初年度に、経営学、数学分野のコーパスを編纂するとしていたが、経営学はコーパスより省き、数学はH25年度編纂することとした。代わりに、H24年度は理学、工学より学術誌10誌を選び、コーパスを編纂した。 研究計画どおり、コロケーションの抽出と分析を行った。 主に、物理化学、化学の論文誌のコーパスから、能動態の他動詞と目的語、主語と受動態の他動詞コロケーションを自動抽出、分析した。目的語、主語は意味により12範疇に分類した。以下の事実が判明した。 物理化学の能動態の他動詞のうち頻出するものは、化学の能動態の他動詞のうち頻出するものとかなり一致しており、目的語として他動詞と共起する名詞の頻度が高いのは、物理化学と化学の間でかなり一致している。受動態の場合も、物理化学の学術誌に頻出するものは、化学の学術誌に頻出するものとかなり一致しており、主語として他動詞と共起する名詞の頻度が高いのは、物理化学と化学の間でかなり一致している。 物理化学および化学誌の能動態の他動詞とその目的語、受動態の他動詞とその主語のコロケーションリストを作成した。物理化学の能動態のリストには1046タイプ、物理化学の受動態のリストには786タイプ、化学の能動態のリストには1036タイプ、化学の受動態のリストには1035タイプのコロケーションが掲載されている。研究代表者のウェブページ上http://www.rs.kagu.tus.ac.jp/makoto/で公開している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究計画において、コロケーションの抽出と分析および5-gramデータの抽出と分析を行うとしていたが、5-gramデータの抽出と分析は中止した。5-gramデータが少なすぎるためである。また、4-gramデータの自動抽出、分析は先行研究でしばしば行われている。3-gramデータはデータが莫大であるため、自動抽出は可能でも、人手による分析が困難である。 そのためコロケーションの抽出と分析に絞ることとなった。コロケーションの抽出は自動的に行うことができるが、分析は人手で行わなければならない。想定したよりも長い期間がかかっている。
|
今後の研究の推進方策 |
H25年度も10本のコーパスの編纂を予定している。理学、工学より学術誌各5誌、計10誌を選び、コーパスを編纂する。 それぞれのコーパスより、能動態の他動詞と目的語、主語と受動態の他動詞コロケーションを自動抽出、分析する。目的語、主語は意味により12範疇に分類する。他動詞は7範疇に分類する。共起の傾向を調査する。コロケーションリストを作成し、公開する。専門分野の研究者にリストを使用してもらい、アンケートを実施する。
|
次年度の研究費の使用計画 |
H25年度もコーパスの編纂のため、アルバイト料を50万円計上している。成果を発表する学会出席のため海外、国内の旅費を計上している。
|