2021 Fiscal Year Research-status Report
オノマトペ語義の体系化を目指した文脈情報付きオノマトペデータベースの構築
Project/Area Number |
17K12791
|
Research Institution | Hokkai-Gakuen University |
Principal Investigator |
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
Project Period (FY) |
2017-04-01 – 2023-03-31
|
Keywords | オノマトペ / 語義 / コロケーション / コーパス |
Outline of Annual Research Achievements |
本研究の目的は、多様なコーパスを分析して、オノマトペの出現傾向および語義の傾向、新出の語義・用法、オノマトペの語義と文脈情報の関係などについての基礎研究を完成させ、『文脈情報付き現代日本語オノマトペデータベース』を構築することである。 2021年度はオノマトペの語義と文脈情報の分析を行い、その結果をまとめて対外発表ならびにデータベースの公開を計画していた。新型コロナウィルスの影響により当初計画していたオノマトペ抽出作業の一部は遂行できなかったが、当該年度は以下の研究成果を得た。 オノマトペデータベースを構築するためには、収集した用例を語義ごとに分類する必要がある。BERTから得られるオノマトペのベクトル表現を用いることで、小規模な訓練データにおける語義分類の自動化を試みたが、訓練データが少ない場合や文脈に特徴がない場合では分類精度が悪く、精度が不十分であることが明らかになった。したがって、オノマトペの辞書にある用法から生成したルールによる語義分類を行う手法を提案した。多義のオノマトペを対象として分類実験を行った結果、いくつかの語義において高い精度が得られた。この成果は学会発表で公表済みである。 また、これまでの分析により得られた知見をまとめ、研究成果を広く一般に発信するために、書籍「自治体DX推進とオープンデータの活用」内で地方議会会議録におけるオノマトペの特徴について執筆した。具体的には、オノマトペを自動で抽出する方法、使用傾向や地域差を述べた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
新型コロナウィルス感染症の影響により、アルバイターにオノマトペの文脈情報の抽出を依頼することができなかったため、全体に遅れが生じた。オノマトペの分析には一定程度の知識と訓練が必要であり、遠隔で進めることは容易ではない。以上のことから、当初計画していたデータベースの公開が実現していない。 上記の理由から、「やや遅れている」と判断し、補助事業期間の延長を申請した。
|
Strategy for Future Research Activity |
2022年度は、引き続きオノマトペの文脈情報の抽出と分析を行い、分析が完了した部分から、データベースの構築と公開を行う。さらに、データベースの規模拡大のため、オノマトペの語義を決めるコロケーションを抽出するためのアルゴリズムを確立する。 新型コロナウィルス感染症の影響が続くことを前提にアルバイターの雇用を断念し、研究協力者間で作業を完結することを目指す。
|
Causes of Carryover |
当初の計画では、アルバイターの雇用、学会での研究成果発表に伴う旅費・参加費を支出する予定であった。しかし、新型コロナウィルス感染症の影響によってアルバイター雇用ができなかったこと、学会がオンライン化したことによって、支出総額が計画よりも少なくなった。 2022年度において、研究協力者とオンラインで共同研究を推進するために必要な機器の購入に充てる。
|
Research Products
(2 results)