2012 Fiscal Year Research-status Report
Project/Area Number |
24520521
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
神崎 享子 豊橋技術科学大学, 情報メディア基盤センター, 研究員 (00450693)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 日本語学 / 語彙 / 複合動詞 / 複合動詞形成の統語的・意味的分析 / 複合動詞データ |
Research Abstract |
1.全体の研究の目的:「動詞+動詞」型の複合動詞は、東アジア言語に特徴的であり特に日本語ではとても発達している。複合動詞の種類が豊富で使用頻度も高いので、日本語学のみならず日本語教育や言語処理など他分野でも、複合動詞研究は重要な課題の一つとなっている。理論的研究や記述的研究が行われる一方で、定量的調査によって統語的・意味的観点からシステマティックに複合動詞をとらえる研究はまだ少ない。本研究では、まず複合動詞形成の統語的・意味的情報をとらえるためのデータを作成し、その作成データを基盤に複合動詞形成の規則の解明を目指している。 2.全体計画の中での実施課題:目的を達成するために、研究全体の手順としては次のようになる。(1)統語的・意味的情報をもつ複合動詞データ作成。 (2)統語と意味のミスマッチの類型化。(3)類型化に従って、複合動詞形成の意味規則について考察。平成24年度は(1)のデータ作成に注力した。 3.具体的作業内容:1や2で述べた目的のために複合動詞形成の統語的・意味的情報を観察するためには、複合動詞と構成動詞の統語と意味のミスマッチをとらえる必要がある。たとえば「降り積もる」という複合動詞の場合、「雪が降り積もる」は言えるが「雨が降り積もる」は言えない。一方、構成動詞で「雪が」は共起して「雨が」が共起できないのは、「積もる」であり「降る」ではない。このように複合動詞と構成動詞の間にある一致・不一致を観察するためのデータを作成する必要がある。そこで、次のような流れで作業を行った。(1) 対象とする約2780語の複合動詞に統語的情報を付与。(2) 5億文のwebコーパスから抽出できた複合動詞約2600語に対して「ガ、ヲ、二、ヘ、カラ、ト、ヨリ、ハ(ガ)」の格にたつ共起名詞を抽出。(3)同時に複合動詞の構成動詞965語についても、(2)と同様の格にたつ共起名詞を抽出した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成24年度は、平成25年度以降の定量的調査研究のベースとなるデータ作成を行うことが中心であった。計画としては、大きく、(1)複合動詞への格パターンの付与、(2)複合動詞とその構成動詞に対して、コーパスからの格ごとの共起名詞の抽出(必要により名詞カテゴリーの付与)、(3)意味役割の付与、であった。 (1) について、当初は1000語程度の複合動詞を対象にする予定であったが、作業が進み、最終的には2600-2700語程度の複合動詞に格パターンを付与し対象にすることにした。また、当初の予定では国立国語研究所から公開されている1億語のコーパス「現代書き言葉均衡コーパス」を主に利用する予定であったが、5億文のwebコーパスが利用可能だったため、データスパースネスの問題を極力回避することを考え、5億文のwebコーパスを利用した。(2)について、5億文のwebコーパスから複合動詞と、複合動詞を構成する動詞に対して、基本的な格と共起名詞を抽出した。当初2725語の複合動詞を対象にしていたが、例文がないなど自動抽出に失敗した複合動詞が118語程度あったため、最終的には2607語の複合動詞に対して共起名詞の抽出を行った。 (3)については、当初は最初に全ての複合動詞に意味役割を付与する予定であったが、意味とも関わるので複合動詞の分析を行う際に同時に考えていく方針にした。 以上、平成24年度計画の達成度についてまとめると、(1)(2)については目標を達成し、(3)については方針の変更を行った。
|
Strategy for Future Research Activity |
平成24年度に構築したデータを元に、構成動詞の組み合わせパターンにしたがって、構成動詞から複合動詞を形成する際にみられる格の継承と意味のずれを調査する。予備実験から構成動詞の組み合わせについては、①格の継承②共起名詞の継承の仕方によって、4通りの組み合わせパターンが考えられる。 (1)両方の構成動詞の格パターンと共起名詞が、複合動詞にすべて継承される場合(例:「持ち帰る」)(2) 一方の動詞の格が継承されるが、共起名詞は主に他方の動詞から継承される場合(「攻め上る」)(3)一方の動詞の格と共起名詞だけが全て継承される場合(「思い上がる」)(4)一方の動詞からは格も共起名詞も継承されているが、他方の動詞からは格だけが継承されている。(「思い当たる」) すでに、各複合動詞と構成動詞に共起する格と名詞のデータは抽出した。それのデータから、2語の構成動詞のうちどちらの(あるいは両方の)構成動詞が、複合動詞に共起名詞を継承しているのかを定量的に調査する。このような共起名詞の継承を、本研究では意味的継承とする。また、複合動詞と構成動詞の統語パターンから、どちらの格を継承しているかも調査する。このような格の継承を、本研究では統語的継承とする。 以上のような統語的、意味的継承の観点から、上記のような複合動詞のタイプによって類型化して、複合動詞の統語と意味のズレについて考察する。構成動詞は複合動詞にどの程度どのようにかかわるのか、複合動詞には構成動詞のどのような統語的意味的要素が影響するのか、また、単なる2語の構成動詞の足し算ではない新たな意味があるか、複合動詞形成にどのような統語的・意味的規則があるかについて考察を行う予定である。計画としては、年度前半に類型化と分析を行い、年度後半には段階的に明らかになった成果の一部を学会などで発表していく予定である。
|
Expenditure Plans for the Next FY Research Funding |
次年度の研究費は1,086,128円である。前半はデータ整備・加工と分析作業であるが、後半は、段階的に成果発表をしていきたいと考えるため、国内旅費1回分の4万円、海外旅費1回分の40万円を計上する。また、データ整備や定量的調査の際に生じるデータ加工の人件費で36万円を計上する。人件費の見積もりは30人日分で特殊技術のため時給2000円、6時間/日で計算している。備品・消耗品費として22万円を計上する。関連書籍や持ち運び用のハードディスクなどを購入予定にしている。その他、事務用品や学会参加費などで66,128円を計上する。
|
Research Products
(4 results)