現代日本語オノマトペの語義とコロケーションに基づくオノマトペ実用辞書の構築
Project/Area Number |
21K12584
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 90020:Library and information science, humanistic and social informatics-related
|
Research Institution | Hokkai-Gakuen University |
Principal Investigator |
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
Co-Investigator(Kenkyū-buntansha) |
荒木 健治 北海道大学, 情報科学研究院, 特任教授 (50202742)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | オノマトペ / 語義 / コロケーション / コーパス / コミック / 語義曖昧性解消 / 自然言語処理 |
Outline of Research at the Start |
オノマトペ(擬音語・擬態語の総称)は日本語において重要な役割を果たしている。しかし、その多義性や用法の複雑さから、工学的な利活用が進展していない。本研究は、多様なコーパスを分析して、オノマトペの出現傾向および語義の傾向、新出の語義・用法、オノマトペの語義と文脈情報の関係などについての基礎研究を完成させ、『現代日本語オノマトペ実用辞書』を構築することを目指すものである。
|
Outline of Annual Research Achievements |
本研究の目的は、多様なコーパスを対象としてオノマトペの用法・語義を定量的に分析し、大規模な『現代日本語オノマトペ実用辞書』を構築することである。2022年度はオノマトペの語義ならびに文脈情報の分析と、辞書の構築を計画していた。当該年度は以下の研究成果を得た。 1.妊娠・出産・育児に関するオンラインコミュニティにおける検索履歴を対象として、オノマトペの出現傾向を分析した。特筆すべき傾向として、ネガティブな感情や心身の不調を表すオノマトペが頻出することが明らかになった。このことから、母親のWeb上での行動から産後うつなどの精神的な不調を早期に検出する際に、オノマトペが手がかかりとして有効であることが示唆された。 2.コミックのコマ画像中に出現するオノマトペの特徴の調査を行った。コミックの画像中のオノマトペは非常に多種多様であり、辞書で定義されていても語の一部が変化している語や、辞書に定義されていない未知語の存在が明らかになった。 3.2021年度に提案したルールベースの語義分類手法の改良を行った。日本語オノマトペの多くは複数の語義を持ち、それらの語義は周辺の文脈によって判別される。オノマトペ語義分類の従来研究では、事前学習済みのBERTモデルから得られるオノマトペのベクトル表現を用いた語義分類の自動化を提案しているが、訓練データを作成するためのアノテーションコストが高く、全てのオノマトペに対して訓練データを豊富に用意することは難しいという問題があった。そこで、低いアノテーションコストで語義分類を自動化するルールベースの語義分類手法に、より特徴的で多くの格解析情報にマッチした語義に分類するような「語義スコア」に導入したアルゴリズムを提案した。 これらの成果は学会発表ならびに査読付き論文で公表済みである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通り、新たなコーパスの整備を行い、オノマトペの語義と文脈情報を分析することができた。また、文脈情報の抽出手法については、正確性を重視する方法と網羅性を重視する方法を提案することができた。 辞書の構築については、データ整理を行うための人材確保が難航したため継続中である。
|
Strategy for Future Research Activity |
2023年度は、2022年度に整備した新たなコーパスからの文脈情報の抽出を行い、分担者とともに語義を分析する。これまでの成果をまとめ、辞書を構築する。
|
Report
(2 results)
Research Products
(8 results)