2001 Fiscal Year Annual Research Report
計量的日本語研究文献のCD-ROM化とその利用技術の開発
Project/Area Number |
11551009
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
荻野 綱男 東京都立大学, 人文学部, 教授 (00111443)
|
Co-Investigator(Kenkyū-buntansha) |
熊谷 康雄 国立国語研究所, 情報資料部門, 部門長 (30215016)
真田 信治 大阪大学, 大学院・文学研究科, 教授 (00099912)
宮島 達夫 京都橘女子大学, 文学部, 教授 (30099915)
|
Keywords | 計量的研究 / 論文データベース / CD-ROM / 日本語研究 |
Research Abstract |
1 計量的日本語研究論文をスキャナでスキャンしたものに対して、画像品質のチェックを全体的に行った。必要に応じて、不良部分を再度スキャンした。 2 モニター数名を募集し、試作段階のCD-ROMを先行配布し、どのように使えるか、どんな問題があるか、体験してもらった。年度末までにコメントを回収し、研究成果報告書に収録した。 3 「語彙」に関する計量的日本語研究論文の全体を概観し、計量言語学の観点から語彙研究を展望し、今後の語彙研究で必要となる点を考察した。 テキストを対象とした計量的な語彙研究を概観すると、異なり語数的なアプローチが多く、延べ語数的なアプローチが不十分である。それは、大規模な語彙調査が国立国語研究所とNHKだけで行われている現状を反映している。今後は、計算機を用いることで個人でも語彙調査が可能になっていくので、延べ語数的アプローチが多くなることを期待する。 多人数調査による計量的な語彙研究の面では、簡単な手法を用いたものや、数量化の諸手法など「データから何かを探ろうとする」アプローチが多く、仮説検証的な実験法によるアプローチがほとんどない。今後は、この方面の研究が多くなることが必要である。 4 収録予定の論文のタイトルや著者名などに含まれる「外字」について、全面的に見直し、単純テキストファイルで表現するとともに、外字をイメージで収録する方針でやっていけることを確認した。 5 年度末に研究成果報告書を作成した。
|
-
[Publications] 荻野 綱男: "各研究論文ではどれくらいの量を調査しているか"日本語学4月臨時増刊. 20巻・5号. 210-223 (2001)
-
[Publications] 荻野 綱男: "調査量が不明の論文を読む-パーセンテージから調査量を推測する-"計量国語学. 23巻・1号. 37-40 (2001)
-
[Publications] 荻野 綱男: "計量言語学の観点から見た語彙研究"国語学. 53巻・1号. 97-115 (2002)