研究課題/領域番号 |
21K12584
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 北海学園大学 |
研究代表者 |
内田 ゆず 北海学園大学, 工学部, 教授 (80583575)
|
研究分担者 |
荒木 健治 北海道大学, 情報科学研究院, 特任教授 (50202742)
木村 泰知 小樽商科大学, 商学部, 教授 (50400073)
高丸 圭一 宇都宮共和大学, シティライフ学部, 教授 (60383121)
乙武 北斗 福岡大学, 工学部, 助教 (20580179)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | オノマトペ / 語義 / コロケーション / コーパス / コミック / 語義曖昧性解消 / 自然言語処理 |
研究開始時の研究の概要 |
オノマトペ(擬音語・擬態語の総称)は日本語において重要な役割を果たしている。しかし、その多義性や用法の複雑さから、工学的な利活用が進展していない。本研究は、多様なコーパスを分析して、オノマトペの出現傾向および語義の傾向、新出の語義・用法、オノマトペの語義と文脈情報の関係などについての基礎研究を完成させ、『現代日本語オノマトペ実用辞書』を構築することを目指すものである。
|
研究実績の概要 |
本研究の目的は、多様なコーパスを対象としてオノマトペの用法・語義を定量的に分析し、大規模な『現代日本語オノマトペ実用辞書』を構築することである。2022年度はオノマトペの語義ならびに文脈情報の分析と、辞書の構築を計画していた。当該年度は以下の研究成果を得た。 1.妊娠・出産・育児に関するオンラインコミュニティにおける検索履歴を対象として、オノマトペの出現傾向を分析した。特筆すべき傾向として、ネガティブな感情や心身の不調を表すオノマトペが頻出することが明らかになった。このことから、母親のWeb上での行動から産後うつなどの精神的な不調を早期に検出する際に、オノマトペが手がかかりとして有効であることが示唆された。 2.コミックのコマ画像中に出現するオノマトペの特徴の調査を行った。コミックの画像中のオノマトペは非常に多種多様であり、辞書で定義されていても語の一部が変化している語や、辞書に定義されていない未知語の存在が明らかになった。 3.2021年度に提案したルールベースの語義分類手法の改良を行った。日本語オノマトペの多くは複数の語義を持ち、それらの語義は周辺の文脈によって判別される。オノマトペ語義分類の従来研究では、事前学習済みのBERTモデルから得られるオノマトペのベクトル表現を用いた語義分類の自動化を提案しているが、訓練データを作成するためのアノテーションコストが高く、全てのオノマトペに対して訓練データを豊富に用意することは難しいという問題があった。そこで、低いアノテーションコストで語義分類を自動化するルールベースの語義分類手法に、より特徴的で多くの格解析情報にマッチした語義に分類するような「語義スコア」に導入したアルゴリズムを提案した。 これらの成果は学会発表ならびに査読付き論文で公表済みである。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通り、新たなコーパスの整備を行い、オノマトペの語義と文脈情報を分析することができた。また、文脈情報の抽出手法については、正確性を重視する方法と網羅性を重視する方法を提案することができた。 辞書の構築については、データ整理を行うための人材確保が難航したため継続中である。
|
今後の研究の推進方策 |
2023年度は、2022年度に整備した新たなコーパスからの文脈情報の抽出を行い、分担者とともに語義を分析する。これまでの成果をまとめ、辞書を構築する。
|