日本語コーパスに対する単語心象性情報付与とその利用
Project/Area Number |
23K21935
|
Project/Area Number (Other) |
22H00663 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 02060:Linguistics-related
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 教授 (80379528)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 祥 目白大学, 外国語学部, 専任講師 (40623004)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,160,000 (Direct Cost: ¥13,200,000、Indirect Cost: ¥3,960,000)
Fiscal Year 2024: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Fiscal Year 2023: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
Fiscal Year 2022: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
|
Keywords | 単語心象性 / クラウドソーシング / コーパス / 印象評定情報 / リーダビリティ / 比喩 / 印象評定 |
Outline of Research at the Start |
本研究では、『現代日本語書き言葉均衡コーパス』に出現する語彙に対して、大規模クラウドソーシングにより、ヒトがどのような印象を受けるか(単語心象性)を調査し、データベース化する。具体的には、提示した単語用例の「自然さ」「わかりやすさ」「古さ」「新しさ」「比喩性」について、用例ごとに数十人規模で心象性の評定値を収集する。対象となるテキストは、係り受け・述語項構造・語義・比喩・読み時間が付与されているコアデータの一部とする。構築した単語心象性データベースに基づき、日本語話者の統語・語義・比喩のとらえ方についての各種理論の検証を行う。さらに単語心象性が読み時間に与える影響についても検証する。
|
Outline of Annual Research Achievements |
2023年度は『日本経済新聞記事オープンコーパス』に対して読み時間とともに「自然さ」「わかりやすさ」「古さ」「新しさ」「比喩性」の情報を付与し、読み時間と印象評定情報との対照分析を行った。その結果、「古さ」が読み時間を延ばす一方で、「自然さ」「わかりやすさ」とともに「比喩性」が読み時間を短縮する効果があることを確認した。この内容について日本認知科学会第40回大会にて発表した。 また、国立国語研究所の過去の著作である『動詞の意味・用法の記述的研究』、『形容詞の意味・用法の記述的研究』、『比喩表現の理論と分類』、『現代語の助詞・助動詞』の例文について電子化を行い、印象評定情報の収集を行った。『比喩表現の理論と分類』の電子化については、国立国語研究所論集に論文を発表した。しかしながら、『動詞の意味・用法の記述的研究』、『形容詞の意味・用法の記述的研究』には、旧字旧かなが含まれており、適切に実験協力者に表示することができなかったため、再調査が必要なことが分かった。再調査に必要な作業として、旧字旧かなも含めてデータの再整備手法について検討を行った。 さらに、『現代日本語書き言葉均衡コーパス』に付与した印象評定情報について、文節係り受け情報や分類語彙表の語義情報との対照分析を進めた。この分析により、印象評定と言語的特徴(統語・語義)の相互関係について検討し、日本語表現の特性や意味のニュアンスに関する検討を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
『動詞の意味・用法の記述的研究』、『形容詞の意味・用法の記述的研究』には、旧字旧かなが含まれており、適切に実験協力者に表示することができなかったため、再調査が必要なことが分かった。
|
Strategy for Future Research Activity |
『現代日本語書き言葉均衡コーパス』に付与した印象評定情報について、文節係り受け情報や分類語彙表番号の語義情報との対照分析を継続的に進める。 また、『動詞の意味・用法の記述的研究』、『形容詞の意味・用法の記述的研究』の旧字旧かなの正規化を行い、再調査を行う。
|
Report
(2 results)
Research Products
(4 results)