研究課題/領域番号 |
17K12791
|
研究機関 | 北海学園大学 |
研究代表者 |
内田 ゆず 北海学園大学, 工学部, 准教授 (80583575)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | オノマトペ / 語義 / コーパス |
研究実績の概要 |
本研究の目的は、多様なコーパスを分析して、オノマトペの出現傾向および語義の傾向、新出の語義・用法、オノマトペの語義と文脈情報の関係などについての基礎研究を完成させ、『文脈情報付き現代日本語オノマトペデータベース』を構築することである。 平成30年度はオノマトペの語義と文脈情報の分析を行い、その結果をまとめて対外発表を行うことを計画していた。この実施計画に則り研究を遂行し、当該年度は以下の研究成果を得た。 雑誌からオノマトペを抽出すると同時に、各オノマトペの係り先や修飾対象を人手で抽出し、文脈情報としてまとめた。さらに、オノマトペの表記揺れを人手で正規化し、実態に即した出現傾向を明らかにした。ここで得たデータにより、特定のドメインでのオノマトペの用法を明らかにできる。 具体的な成果としては、幼児向け雑誌11冊から737語のオノマトペ(延べ数)を抽出した。他のドメインと比較すると、係り先の動詞が省略される例やオノマトペを単独で用いる例、辞書にはないオノマトペを使用する例、同じオノマトペを繰り返し用いる例が特徴的であった。幼児向け雑誌を対象としたオノマトペの文脈分析はこれまでに行われておらず、あらたな知見が得られたといえる。同様の分析を他ドメインでも継続しており、スポーツ、ファッション分野のオノマトペの特徴も明らかにする予定である。 さらに、これまでに得られたオノマトペの用法や語義、応用例についての知見をまとめ、学会誌の解説記事や招待講演で広く発信した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
オノマトペの文脈情報を抽出する作業を複数のアルバイターに依頼して進めているが、計画時点での想定よりも多大な労力が必要であることが明らかになっている。特に、オノマトペか否かを判断する過程や、オノマトペ周辺の省略された文脈を補完する作業では、研究代表者とアルバイター、および研究協力者で協議する必要がある。したがって、コーパスの規模については当初の目標の達成がやや不十分である。 上記の理由から、「進行状況はやや遅れている」と判断する。
|
今後の研究の推進方策 |
平成31年度は、引き続きオノマトペの文脈情報の抽出と分析を行う。分析が完了した部分から、データベースの構築と公開を行う。その際、自然言語処理への応用も考慮したデータベースの形式を考案する必要がある。特に、自然言語処理技術の基礎となるシステム(形態素解析器等)に必要な辞書データにはオノマトペの語彙が不足している。この問題の解決に貢献するようなデータベースの構築を目指す。
|
次年度使用額が生じた理由 |
当初の計画では、コーパス構築に必要なデータ抽出のためにアルバイター6名を雇用する予定あった。しかし、当該作業の適任者が3名しか確保できず、アルバイターへの謝金の総額が計画よりも少なくなった。その結果、次年度使用額が生じた。 平成31年度には、オノマトペの文脈情報を複数名でアノテーションする予定である。次年度使用額はその際に必要な物品の購入やアルバイターへの謝金に使用する予定である。
|