2008 Fiscal Year Annual Research Report
ロシアおよびその周辺の少数言語のコーパスの構築と記述的・歴史的研究
Project/Area Number |
18202010
|
Research Institution | The University of Tokyo |
Principal Investigator |
松村 一登 The University of Tokyo, 大学院・人文社会系研究科, 教授 (40165866)
|
Co-Investigator(Kenkyū-buntansha) |
後藤 斉 東北大学, 大学院・文学研究科, 教授 (90162156)
千葉 庄寿 麗澤大学, 外国語学部, 准教授 (70337723)
小森 宏美 京都大学, 地域研究統合情報センター, 准教授 (50353454)
|
Keywords | 言語学 / 外国語 / コーパス / 少数言語 / ウラル諸語 / ロシア:エストニア / 言語資料 / 国際研究者交流 |
Research Abstract |
前年度にOCR(光学的文字認識)によって文字データ化した,20世紀初頭のエストニア語の言語資料(エストニア憲法制定会議議事録,1919〜1920)のテクストの校正(OCR誤認識の修正)の作業が終了し,その全体を整形加工してXML文書化し,コーパスとして利用できるように整えた。このコーパスは「エストニア憲法制定会議議事録コーパス」として公開され,エストニア語コーパスの開発に携わるタルト大学(エストニア)の研究者から貴重な言語資料として評価された。 「エストニア憲法制定会議議事録コーパス」や,これまでにコーパスとして利用できるように加工し蓄積してきた,エストニア語の新聞記事や文学作品などの言語資料を利用して,エストニア語の語彙や用法の統計的,歴史的な研究を行った(松村一登,研究代表者;小森宏美,研究分担者)。用例検索には,Per1言語を使って独自に開発されたツールを使った。エストニア語のコーパスを利用した研究の成果の発表を日本ウラル学会と日本言語学会で行った(松村一登,研究代表者)。 エストニア語(エストニア共和国)の現地調査と言語資料の収集を行った(松村一登,研究代表者;小森宏美,研究分担者)。 マリ語(ロシア・マリエル共和国,田中孝史,研究協力者)の現地調査と言語資料の収集を行った。フィンランドのトゥルク大学の研究者と共同で開発しているマリ語のコーパスを利用した研究を行った(田中孝史,研究協力者)。
|