2020 Fiscal Year Research-status Report
Figurative Expression Extraction from Corpora and Analysis
Project/Area Number |
18K18519
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
浅原 正幸 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, 教授 (80379528)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 祥 目白大学, 外国語学部, 専任講師 (40623004)
|
Project Period (FY) |
2018-06-29 – 2022-03-31
|
Keywords | 比喩 / コーパス / 語義 / アノテーション |
Outline of Annual Research Achievements |
『現代日本語書き言葉均衡コーパス』に基づいた指標比喩データベース構築の論文執筆を行い、論文誌『自然言語処理』に採択された。同データベースは中村明著『比喩表現の理論と分類』に基づく指標比喩データベースとともに整理をしたうえで、2022年夏に公開する。指標比喩については「同一性否定の手がかり句」に関する整理を進め、検討を行った。また新聞の記事分類情報の整理を行い、記事分類と比喩表現の出現の傾向についても検討を行った。 同様に『現代日本語書き言葉均衡コーパス』『比喩表現の理論と分類』に基づいた結合比喩データベースの整備を進めた。手がかりとして分類語彙表に基づく語義情報を付与し、語義の連接がどのように分布するかを整理した。この結合比喩の整理は 2020年度中に終わらなかったために、引き続き継続して整理を進める。 また、指標比喩・結合比喩データベースともに、一般の方がどのように知覚するかについての比喩性・新しさ・わかりやすさ・人にたとえているか・具体的かなどについてアンケート調査を進めた。調査結果から、一般の方の比喩の知覚傾向を明らかにした。 さらに計算言語学的な観点から、超大規模ウェブコーパスで学習した文脈化単語埋め込みに基づく多義語の語義的な距離の可視化についても進めた。 上記の通り、指標比喩・結合比喩に対して、アノテーション(手がかり句・語義・語義の連接)・知覚実験結果・文脈化単語埋め込みといった多角的な観点から分析可能なデータベース構築を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
アノテーション・計算言語学的検討においては順調に進めることができたが、ヒトを対象としたアンケート調査について順調にすすめることができなかった。
|
Strategy for Future Research Activity |
クラウドソーシングを導入することで、接触を伴わずにアンケート調査を行う体制を整えた。今後、クラウドソーシングを活用し、残りのアンケート調査について早急に進める。
|
Causes of Carryover |
アンケート調査の方式をクラウドソーシング主体に変更する準備に時間を要したために、2020年度内にすべてのアンケート調査を行うことができなかった。2021年4-5月に残りのアンケート調査を行う予定である。
|