• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

大規模コーパスに基づく現代語表記のゆれの実態解明

研究課題

研究課題/領域番号 25370532
研究機関立命館大学

研究代表者

小椋 秀樹  立命館大学, 文学部, 准教授 (00321547)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード文字 / コーパス
研究実績の概要

『現代日本語書き言葉均衡コーパス』(以下,BCCWJと略す。)に収録されたレジスターのうち,出版サブコーパス(2001年~2005年発行の新聞・雑誌・書籍,延べ約3,500万語),特定目的サブコーパスのYahoo!ブログ(2008年4月~2009年4月,延べ約1000万語)を資料とし,調査・分析の基本資料となる「表記一覧表」の作成を進めた。平成26年度は,「表記一覧表」の校正作業を進めるとともに,「表記一覧表」に掲げた各語についてエントロピーを算出し,新たな情報として付与した。
また,「表記一覧表」の作成と並行して,語表記のゆれに関する分析をより本格化させた。
まず語表記のゆれがしばしば問題となる外来語に着目し,表記のゆれの実態調査を行った。特に,表記の基準作成等の場面で問題となることの多い語末長音に着目し,BCCWJの出版サブコーパス,特定目的サブコーパスのWeb(Yahoo!知恵袋,Yahoo!ブログ,延べ約2000万語)を調査資料として,表記のゆれの実態調査を行った。その結果,外来語語末長音はゆれの割合の高い要素であること,そのゆれには,原語の語末による差があることなどを明らかにし,論文にまとめ発表した。
次に,予備的分析において語表記のゆれの割合が高い語群であることが明らかとなった和語に着目し,その中でも特に語表記のゆれの割合が高い複合動詞を取り上げ,表記のゆれの経年変化を明らかにした。この調査では,統語的複合動詞の後項動詞を対象とした。後項動詞を平仮名で表記するか,漢字で表記するかに着目し,出版年代別,著者の生年代別に表記の変遷を調査した。その結果,出版年代別,著者の生年代別とも年代が下るにしたがって,漢字表記の割合が高くなることを明らかにし,学会において発表した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

語表記のゆれを調査・分析するための基本資料となる「表記一覧表」に新たな情報を付与するなど,その作成作業をほぼ予定どおりに進めた。
また,平成25年度までに実施した,BCCWJのコアデータを対象とした予備的分析を踏まえて,語を限定したものではあるが,非コアデータも含めた調査を語表記のゆれに関する実態調査((1)外来語の語末長音のゆれに関する実態調査と,(2)統語的複合動詞のゆれに関する経年調査)を実施した。
以上のように,基本資料の作成と並行して,語を限定したものではあるが,より大規模なデータを資料とした調査を実施しており,本研究はおおむね順調に進展していると判断した。

今後の研究の推進方策

1.「表記一覧表」に掲載する情報について,精査を行い,その結果を踏まえ,必要に応じて情報の追加を行う。また,研究計画の最終年度であることから,「表記一覧表」のインターネット上での公開を目標に,校正作業を行う。
2.レジスター別の語表記のゆれに関する調査結果(語表記のゆれの多い語群や少ない語群,ゆれのない語群の一覧。語種別・品詞別・語構成別・頻度別に語表記のゆれが多く見られるのか(あるいは見られないのか)を調査した結果等。)を比較し,語表記のゆれが媒体によってどのように異なるのか,あるいはどういう点について共通性があるのかといったことを明らかにする。
3.語表記のゆれが生じる要因について,言語内的観点,言語外的観点から考察を行う。
4.語表記のゆれに関する調査結果について,日本語学会等で発表する。

次年度使用額が生じた理由

次年度使用額が生じた理由は次の2点である。
1.国際学会での発表を予定し,その費用を計上していたが,授業及び校務と発表を計画していた国際学会の日程が合わず,発表申込み自体ができなかった。
2.平成26年度にアルバイターを確保できなかった反省を踏まえ,コンピューターによる作業自体が比較的単純なものとなることからアルバイターに求める要件を引き下げた。しかしながら,適任者がいても勤務日程が合わないなどの問題があり,雇用開始が遅れた。

次年度使用額の使用計画

次年度使用額は,下記1.のための旅費・学会参加費,及び下記2.のための謝金(アルバイター)に使用する。
1.平成27年度は,研究計画最終年度であることから,日本語学会をはじめ,言語処理学会,社会言語科学会等の学会において,これまでの研究成果で発表に至っていないもの,及び平成27年度の研究成果の発表を行っていく。
2.語表記のゆれを調査・分析するための基本資料となる「表記一覧表」を再度精査を行い,その結果を踏まえ,必要に応じて情報の追加を行う。また,「表記一覧表」のインターネット上での公開を目標に,複数のアルバイターによる校正作業を行い,高精度なデータとなるようにする。

  • 研究成果

    (3件)

すべて 2014

すべて 雑誌論文 (2件) 学会発表 (1件)

  • [雑誌論文] 外来語語末長音の表記のゆれについて2014

    • 著者名/発表者名
      小椋秀樹
    • 雑誌名

      論究日本文学

      巻: 100 ページ: 195-208

  • [雑誌論文] コーパス活用の勘所 第8回【現代語】表記(1)『現代日本語書き言葉均衡コーパス』による表記の研究2014

    • 著者名/発表者名
      小椋秀樹
    • 雑誌名

      日本語学

      巻: 33-13 ページ: 78-83

  • [学会発表] BCCWJ における複合動詞後項の表記の実態2014

    • 著者名/発表者名
      小椋秀樹
    • 学会等名
      第6回コーパス日本語学ワークショップ
    • 発表場所
      国立国語研究所(東京都立川市)
    • 年月日
      2014-09-10

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi