2014 Fiscal Year Research-status Report
フィリピン語辞典編纂のためのコーパス構築と携帯端末用アプリの開発研究
Project/Area Number |
25580129
|
Research Institution | Osaka University |
Principal Investigator |
大上 正直 大阪大学, 言語文化研究科(研究院), 教授 (30233034)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 辞書論 / フィリピン語 / コーパス言語学 |
Outline of Annual Research Achievements |
1. 話し言葉コーパスの構築:平成25年度に次年度の計画を一部前倒しして,フィリピン語の人気ラジオ番組およびフィリピン国立大学の学生による会話を収録して,これらの音声データの文字おこしを行ったが,本年度は上記データに加えてさらにYou Tube上に掲載された動画(①自然会話,②映画,③トークショー,④インタビューなど)を収集し,文字おこしを行った。また,市販の,あるいはインターネット上の大衆・若者向け恋愛小説のデータ収集を行い,会話部分のみを抽出し話し言葉コーパスの一部として使用できるよう整理(入力)した。最終的に,昨年度および本年度のコーパスをすべて統合し1つのコーパスとして完成させた。
2. 書き言葉コーパスの構築:書き言葉についての作業は本年度の計画には予定されていなかったが,昨年度に構築したコーパスのうち,タブロイド新聞(社説,国内ニュースなど)のデータ量が他のいくつかのジャンルのものと比較してあまりにも膨大で,バランスを欠くため,約半分くらいのデータ量になるように減らす作業を上記1.の作業と並行して行った。そして最終的な書き言葉コーパスとして使えるように改善・整備した。
3. なお,実際に辞書アプリ(β版)を開発するにあたり,そのコンテンツを作成する上で参考にできるように,上記1.の話し言葉コーパスおよび2.の書き言葉コーパスのそれぞれのデータを頻度順あるいはアルファベット順に配列した語彙リストを作成した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
自己点検により上記評価を下した理由は以下のとおりである。
昨年度の書き言葉コーパスの構築に加えて,本年度の主な目標であった話し言葉コーパスが構築できたことにより,次年度におけるコンテンツ(主見出し語,小見出し語,語義,用例とその日本語訳など)の作成とアプリ開発に向けての準備がおおむね整った。
|
Strategy for Future Research Activity |
平成26年度に実施した研究における課題と今後の推進方策は以下のとおりである。
言語コーパスの構築に際しては,書き言葉と話し言葉が量的にバランスが取れていることが望ましいのは言うまでもない。ただ,話し言葉については,昨年度も同様に経験したことではあるが,新たな音声データの収録・文字おこしを行ったり,大衆・若者向け恋愛小説などのデータから会話部分を抽出し,整理(入力)する必要があるため,膨大な時間と労力を要し,書き言葉ほどの分量はどうしても構築できなかった。いずれにしても,話し言葉コーパスに収録されている日常的な表現は口語調の表現を駆使した用例を作成する上で極めて有益であり,十分に活用して行きたい。
|
Causes of Carryover |
人件費用として300,000円ほど前倒し請求したが,アルバイトに依頼する作業の量が予期したレベルより下回ったため,半分くらいの額が余った。
|
Expenditure Plan for Carryover Budget |
余剰の144,887円は,次年度の人件費に使用する予定である。
|