2017 Fiscal Year Annual Research Report
The obtainability of the information from text corpora and its cognitive analytics
Project/Area Number |
26770156
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
加藤 祥 (保田祥) 大学共同利用機関法人人間文化研究機構国立国語研究所, コーパス開発センター, プロジェクト非常勤研究員 (40623004)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 対象物認知 / コーパスから取得可能な情報 / テキスト情報 / 情報の提示順序 |
Outline of Annual Research Achievements |
平成29年度は、本課題研究の最終年度として、研究成果のまとめと考案モデルの検証を進めた。まず、コーパスから収集可能なデータの特徴についての研究成果をまとめ、「特徴的な要素と用例頻度の関係 : 角を例とした一考察」が『国立国語研究所論集』14号(2018年1月)に掲載された。データの提示順序についての研究成果は、「テキストからの対象物認識に有用な情報提示順序―動物の説明文を用いた調査例―」として、『国立国語研究所論集』に掲載が決定している。表現形式のひとつとして比喩に着目した分析結果は、「隠喩と直喩の違いは何か―用例に見る隠喩と直喩の使い分けから―」として、『認知言語学研究』第3巻への掲載が決定している。このほか、動物の説明文にとどまらないテキスト内容の要約と、読み手の認識についても調査を進め、社会言語科学会第41回大会(2018年3月)において発表を行った。 また、調査対象についても、前年度までに扱っていた動物に留まらない植物や静物(道具)などの名詞に拡充し、調査データ整備を進めた。動物についても、これまでの成果を応用したデータ整備を行い、検証実験を行った。これらの成果も現在発表や論文投稿を予定している。本課題研究の目指した「何がどのように書いてあれば読み手がテキスト内容を認識するのか」という観点で整理した「テキストからの取得データ」も、準備が整い次第公開する予定である。 本課題研究は、コーパスから収集したテキストがどのような種類の内容であるのかを整理し、読み手がテキスト内容をどのように認識するのかという実験によって、テキストと情報の関係を考察した。今後、辞書の語釈記述や適確な内容伝達に際し、それらの表現や情報提示順序を提案するなど、実際的な応用を目指す。
|
Research Products
(4 results)