Outline of Annual Research Achievements |
テキストの検索システムと統計処理システムを合体したプログラム集を「言語分析による文字と数値」(LYNEAL: Letras y Numeros en Analisis Linguisticos)と名づけ、東京大学とマドリード自治大学のサーバーで稼働を開始した。システムのプログラムコードはJavaScriptを使用した。日本とスペインの研究プロジェクトチームCODEA, CORHEN, DCVB, LEMI, PROGRAMES, LLI-UAM, VARIGRAMA, VARIOSの協力を得てテキストデータを収集した。 従来の相関係数から派生した多変量解析法に加えて、距離・近接関係を係数化した多変量解析法を開発し、本研究に応用した。 合わせて、古文転写法と批判転写法の対応化の規則集を作成し、一部の実験を完了した。これによって、代表形から個別の語形を検索し、その地域・年代・文書類型・文字種をパラメータにした語形分類リストを作成した。 偏在言語特徴として、以下の書記法を取り上げ、実験を重ねた。(C:子音、V:母音、<…>略字):(1) 語頭のrr- / R- / r-, (2) ff- / f- / h- / 消失, (3) ss- / s-, (4) -ss- / -s-, (5) x / j, (6) u / v / b、(7) i / j / y, (8) c, / c / z, (9) 語尾eの過度の脱落とその復元形(part / parte), (10) pora / para, (11) qua- / cua, (12) -t / -d, (13) [mnu] + j / [mnu] + i, (14) nn / <n>n / n<n> , (15) <n>C / nC, (16) q<uV> / quV, (17) C<Vr|rV> / C(Vr|rV), (18) <e>l / el, (19) d<e> / de。 3月中旬にスペインから、アルカラ大学のPedro Sanchez-Prieto教授を招へいし、3月下旬に上田が米国・ハーバード大学のセルバンテス文化センターでFrancisco Moreno教授と研究打ち合わせのために渡航して本年度の調査対象文書と言語特徴の分布について討論した。他の研究グループの研究動向について資料を収集した。成果を国際学会・国内研究会・インターネットで発表した。
|