2022 Fiscal Year Research-status Report
現代日本語オノマトペの語義とコロケーションに基づくオノマトペ実用辞書の構築
Project/Area Number |
21K12584
|
Research Institution | Hokkai-Gakuen University |
Principal Investigator |
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
Co-Investigator(Kenkyū-buntansha) |
荒木 健治 北海道大学, 情報科学研究院, 特任教授 (50202742)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | オノマトペ / 語義 / コロケーション / コーパス / コミック |
Outline of Annual Research Achievements |
本研究の目的は、多様なコーパスを対象としてオノマトペの用法・語義を定量的に分析し、大規模な『現代日本語オノマトペ実用辞書』を構築することである。2022年度はオノマトペの語義ならびに文脈情報の分析と、辞書の構築を計画していた。当該年度は以下の研究成果を得た。 1.妊娠・出産・育児に関するオンラインコミュニティにおける検索履歴を対象として、オノマトペの出現傾向を分析した。特筆すべき傾向として、ネガティブな感情や心身の不調を表すオノマトペが頻出することが明らかになった。このことから、母親のWeb上での行動から産後うつなどの精神的な不調を早期に検出する際に、オノマトペが手がかかりとして有効であることが示唆された。 2.コミックのコマ画像中に出現するオノマトペの特徴の調査を行った。コミックの画像中のオノマトペは非常に多種多様であり、辞書で定義されていても語の一部が変化している語や、辞書に定義されていない未知語の存在が明らかになった。 3.2021年度に提案したルールベースの語義分類手法の改良を行った。日本語オノマトペの多くは複数の語義を持ち、それらの語義は周辺の文脈によって判別される。オノマトペ語義分類の従来研究では、事前学習済みのBERTモデルから得られるオノマトペのベクトル表現を用いた語義分類の自動化を提案しているが、訓練データを作成するためのアノテーションコストが高く、全てのオノマトペに対して訓練データを豊富に用意することは難しいという問題があった。そこで、低いアノテーションコストで語義分類を自動化するルールベースの語義分類手法に、より特徴的で多くの格解析情報にマッチした語義に分類するような「語義スコア」に導入したアルゴリズムを提案した。 これらの成果は学会発表ならびに査読付き論文で公表済みである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通り、新たなコーパスの整備を行い、オノマトペの語義と文脈情報を分析することができた。また、文脈情報の抽出手法については、正確性を重視する方法と網羅性を重視する方法を提案することができた。 辞書の構築については、データ整理を行うための人材確保が難航したため継続中である。
|
Strategy for Future Research Activity |
2023年度は、2022年度に整備した新たなコーパスからの文脈情報の抽出を行い、分担者とともに語義を分析する。これまでの成果をまとめ、辞書を構築する。
|
Causes of Carryover |
当初の計画では、アルバイターの雇用、学会での研究成果発表に伴う旅費・参加費を支出する予定であった。しかし、新型コロナウィルス感染症の影響によってアルバイター雇用ができなかったこと、学会がオンライン化したことによって、支出総額が計画よりも少なくなった。 未使用額は2023年度において、オンサイトで開催される学会への旅費・参加費に充てる。
|
Research Products
(6 results)