1991 Fiscal Year Annual Research Report
Project/Area Number |
03610194
|
Research Institution | Osaka International University |
Principal Investigator |
柴山 守 大阪国際大学, 経営情報学部, 助教授 (10162645)
|
Keywords | タイ語形態素解析 / タイ語音節認識モデル / タイ語分かち書き / 計算機索引 / タイ語動詞パタ-ン / 古文書画像処理 |
Research Abstract |
1.タイ語近世法制史史料に対する形態素解析の手法と実験・評価及びタイ語音節認識モデルと音節認識機構の実現・評価を行った。形態素解析では、タイ語の音節構造や正書法の言語学的分析から音節形成規則を導出、定義して分かち書きの実験を行い、新たにバックトラック機能を備えた音節最長一致法を提案し、従来の最長一致法に比べ約3%向上することを確認し、有効性を確認した。また,文の音節単位への分割のために有限オ-トマトンによるタイ語音節認識モデルを構築し、タイ語音節認識機構を実現した。本認識機構による自動分かち書きの実験から、ヒュ-リスティクな手法による音節認識モデルと機構の改良により、形態素解析辞書を使用せずに約94%の分かち書き率が得られることを確認した。 2.タイ語の近世法制史史料(三印法典,1805年編纂)の計算機索引試用版に基づいて,見出し語約2万語の英語への翻訳作業を実施した本作業は,史料に出現する語の用法・分類・年代的比較を行う上で極めて重要である。 3.タイ語資料の分析には,構文構造を明確にすることが必要であり、文構造の経年的変化を調査する上でも重要である。タイ語動詞パタ-ン辞書作成のために、日本語用言の結合価を例にして、日本語用言1154語のタイ語動詞への翻訳作業を実施した。 4.タイ語近世史料収集のためのコンピュ-タ入力の一手法として,ビデオ・カメラ入力のための古文書の接続処理の実験を行った。タイ国内に分散して保存されている古文書のデ-タベ-ス化への手法として,今後研究を進めていく計画でいる。
|
Research Products
(3 results)
-
[Publications] Mamoru SHIBAYAMA: "Thai Morphological Analyses Based on the Syllable Formation Rules" Journal of Information Processing情報処理学会欧文誌. 16. (1992)
-
[Publications] 柴山 守: "古文書画像のマッチングについて" 京都大学大型計算機センタ-第35回研究セミナ-報告ISSN0910ー3201. 3-14 (1992)
-
[Publications] 柴山 守: "古文書画像の接続処理と圧縮/伸長" 情報処理学会人文科学とコンピュ-タ研究会 平成4年6月. (1992)