• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

フィリピン語辞典編纂のためのコーパス構築と携帯端末用アプリの開発研究

研究課題

研究課題/領域番号 25580129
研究種目

挑戦的萌芽研究

研究機関大阪大学

研究代表者

大上 正直  大阪大学, 言語文化研究科(研究院), 教授 (30233034)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード辞書論 / フィリピン語 / コーパス言語学
研究概要

本年度の研究計画・方法に沿って本研究を進め,具体的に以下のことを実施した。
1. 書き言葉コーパスの構築:主としてフィリピン語タブロイド新聞(社説,国内ニュースなど),大衆(若者向け小説,恋愛小説,などのジャンルからデータを収集した。収録語数はおおよそ800万語に及ぶ。書き言葉コーパスとしては十分なデータになったと考える。なお,雑誌については,各方面に当たってみたが,入手方法が簡単で,かつ内容がデータとして信頼できるものがほとんどないことが判明したため,今回のデータ収集の作業には含めなかった。
2. 話し言葉コーパスの収集の構築:平成26年度に行う予定の話し言葉コーパスの構築作業の一部を前倒しして,平成25年8月にフィリピン語の人気ラジオ番組(15時間分)およびフィリピン国立大学の学生(36名)による会話を収録し,その後数か月にわたりこれら音声データの文字おこしを行った。データの語数はおおよそ25万語である。上記文字おこしに際しては,同大学のスタッフ数名に協力を仰いだが,成果物に現れるさまざまの語彙の綴りが協力者によってそれぞれ異なっていたため,責任者を一人決め,編集・統一してもらった。綴りについては「自己流」がまかり通って,国民の間であまり統一が図られていないため,昨年年初に,フィリピン国立国語研究所が新たな「正書法」を発表したが,国民の間にはさほど浸透・定着しておらず,複数の研究協力者に文字おこしなどの作業を行ってもらう場合などには,今後とも十分な配慮を要する。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

自己点検により上記評価を下した理由は以下のとおりである。
1.書き言葉コーパスの構築:雑誌などからのデータ収集は行えなかったものの,それ以外は本年度の「研究計画・方法」で立てた計画の内容にほほ沿ってデータ収集を行うことができた。しかも,当初の予想をはるかに超えた量のデータを収集するに至ったのは大きな成果であった。
2.話し言葉コーパスの構築:平成26年度の「研究計画・方法」に記載した話し言葉コーパスの構築にも一歩踏み込んで,現地のラジオ番組や学生の会話から音声データを収集・文字おこしできたことは,次年度の計画を遂行する上でのいわゆる地ならしとなり,一定の成果であった。

今後の研究の推進方策

平成25年度に実施した研究における課題と今後の推進方策は以下のとおりである。
言語コーパスの構築に際しては,書き言葉と話し言葉のデータのバランスが取れていることが理想であるが,後者の場合には,新たな音声データを収録・文字おこしするのに予想以上に多くの時間と労力を要し,その割に成果が限られているため,文字化された既存の音声データはきわめて限られてはいるものの,各方面に広く接触を図り,可能な限りのデータ収集に努める所存である。

次年度の研究費の使用計画

人件費が予定(見込み)より減ったため,10,450円ほど余った。
余剰の10,450円は次年度の人件費として使用する予定である。

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi