研究課題/領域番号 |
17K18505
|
研究機関 | 大学共同利用機関法人人間文化研究機構国立国語研究所 |
研究代表者 |
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30182489)
|
研究分担者 |
藤本 灯 京都府立大学, 文学部, 講師 (20733017)
大西 拓一郎 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 教授 (30213797)
新野 直哉 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 准教授 (30218086)
高田 智和 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語変化研究領域, 准教授 (90415612)
|
研究期間 (年度) |
2017-06-30 – 2020-03-31
|
キーワード | 学術用語 / 概念体系 / 古辞書 / 言語地図 / 言語記事 |
研究実績の概要 |
1 国立国語研究所の「日本語研究・日本語教育文献データベース」(224,207件)から,キーワードが付けられているの70140件を抜き出した。これらのキーワードの異なりは約35500語であった。この中から文法の分野に現れる,頻度2以上のキーワード約3900語についてオントロジー化を進めた。 2 学術用語以外の二次情報の集約については,『二十巻本和名類聚抄』に含まれる5640カ所の和訓のうち,3284項目に対して,形態論情報(語彙素,語彙素読み,品詞,語種,語彙素ID)を付与して検索できるようにした。これらの中には,「紅藍(くれのあい)」のような複合語を「くれ」「の」「あい」に分割したものを含む。言語地図については,「国立国語研究所言語地図データベース」のうち,GIS画像を含む「言語地図画像データベース」から,19種の地図集に含まれる地図名に対して形態論情報を付与した。項目数は1654である(複合語を分割した場合を含む)。言語記事情報は,言葉について言及された新聞・冊子の記事のメタ情報であるが,新聞記事は、大正期の『読売新聞』(大正2(1913)年,大正6(1917))の記事に現れたもの552記事に付された119のキーワードに対して形態論情報を付与した。雑誌記事は『文藝春秋』の大正12(192)年1月(創刊号)~昭和20(1945)年に含まれる849の記事に付けられた471のキーワードに対して形態論情報を付与した。 3 佐藤喜代治編『語彙研究文献語別目録』(1983年,明治書院刊)を著作権継承者の承諾を得て,データベース化した。項目数は約17300である。このうち12325項目について形態論情報を付与し,データベースで検索できるようにした。 4.上記で整備した各データと「日本語歴史コーパス(CHJ)」「現代日本語書き言葉均衡コーパス(BCCWJ)」から得た統計情報も検索できるようにした語誌情報ポータルのサイトを2019年3月に内部公開した。(https://goshidb.ninjal.ac.jp/goshidb/)
|