2010 Fiscal Year Annual Research Report
日本語教育のためのコーパスに基づく文法項目データベース構築と検索システムの公開
Project/Area Number |
22520538
|
Research Institution | Toyo University |
Principal Investigator |
堀 恵子 東洋大学, 人間科学総合研究所, 客員研究員 (70420809)
|
Co-Investigator(Kenkyū-buntansha) |
江田 すみれ 日本女子大学, 文学部, 教授 (80205583)
李 在鎬 桜美林大学, 言語教育研究科, 客員講師 (20450695)
|
Keywords | 文法項目 / 複合辞 / 日本語教育 / 検索エンジン / 日本語能力試験 / コーパス / データベース / 目視 |
Research Abstract |
本プロジェクトは5つの部分からなる。(1)文法項目の選定と検索仕様の決定,(2)コーパス分析したデータから用例を検索する,(3)目視による用例精査,(4)用例の二重チェック,(5)データベースに格納,web上での一般公開,である。22年度はこのうち,全体計画と,(1)から(3)の段階を行った。 (1)文法項目の選定については,堀,江田によって,日本語能力試験出題基準と『現代語複合辞用例集』の付表にある項目をもとに,『日本語表現文型』『現代語の助詞・助動詞』『日本語文型辞典』に取り上げられている項目と各記述を元に選定を行った。2011年3月の時点で1414項目を見出し語として取り上げた。引き続き,見出し語の階層化を進め,項目を精査している。 また,検索対象とするコーパス収集を行い,文章表現,口頭表現のバランス,web上で公開することなどの事情から,下記のものに決定した。(略記) 文章表現:「日英対訳文対応付けデータ」「ブログデータ(京都大学.NTTによる)」「白書」「CASTEL/J」教科書データ 口頭表現:「上村コーパス」「宇都宮大学(UUDB)」「名大会話コーパス」「BTSによる多言語話し言葉日本語会話1」 (2)の検索作業については,李によって上記コーパスのテキスト化を終え,日本語能力試験出題基準の項目を中心に試験的にサンプルデータ抽出を行った。抽出方法について三者で確認を行い,引き続き話し言葉のコーパスを対象に,第一次,第二次のデータ抽出を行った。その後(3)目視による用例精査を堀,江田によって開始した。用例精査にあたって,大学院生によるアルバイトによって作業補助をさせた。
|
Research Products
(1 results)