研究概要 |
前年度にOCR(光学的文字認識)によって文字データ化した,20世紀初頭のエストニア語の言語資料(エストニア憲法制定会議議事録,1919〜1920)のテクストの校正(OCR誤認識の修正)の作業が終了し,その全体を整形加工してXML文書化し,コーパスとして利用できるように整えた。このコーパスは「エストニア憲法制定会議議事録コーパス」として公開され,エストニア語コーパスの開発に携わるタルト大学(エストニア)の研究者から貴重な言語資料として評価された。 「エストニア憲法制定会議議事録コーパス」や,これまでにコーパスとして利用できるように加工し蓄積してきた,エストニア語の新聞記事や文学作品などの言語資料を利用して,エストニア語の語彙や用法の統計的,歴史的な研究を行った(松村一登,研究代表者;小森宏美,研究分担者)。用例検索には,Per1言語を使って独自に開発されたツールを使った。エストニア語のコーパスを利用した研究の成果の発表を日本ウラル学会と日本言語学会で行った(松村一登,研究代表者)。 エストニア語(エストニア共和国)の現地調査と言語資料の収集を行った(松村一登,研究代表者;小森宏美,研究分担者)。 マリ語(ロシア・マリエル共和国,田中孝史,研究協力者)の現地調査と言語資料の収集を行った。フィンランドのトゥルク大学の研究者と共同で開発しているマリ語のコーパスを利用した研究を行った(田中孝史,研究協力者)。
|