2007 Fiscal Year Annual Research Report
Project/Area Number |
19520375
|
Research Institution | Doshisha University |
Principal Investigator |
油谷 幸利 Doshisha University, 言語文化教育研究センター, 教授 (50122362)
|
Keywords | 朝鮮語 / Web辞典 / アルゴリズム |
Research Abstract |
1.Web辞典の見出し語総数:4047項目(2008年4月2日現在) 第1年目の目標である小学館『朝鮮語辞典』の最重要語1350語は全て見出し語として入力できた。 用例を付与できた項目は約2000項目である。 2.見出し語として入力した同形異語は90語である。(2008年4月2日現在) 3.既存の辞書に見出し語として記載されていない新語と,見出し語にはあっても記述されていない新たな語語義解説の追加を85項目にわたって行った。 4.アルゴリズムによる形態素解析を記述した。扱った文法項目は以下の通りである。 (1)前処理 1)用言:規則活用(〓語幹と〓語幹を含む)のみ。変則活用には未対応。 2)スピーチレベル:格式丁寧体と略式丁寧体に対応。平叙形と疑問形に対応。 3)時制:現在,過去,未来,大過去に対応。 4)助詞:〓 5)語尾:〓 (2)解析規則の再帰的な適用 1)助詞結合:〓,…など 2)語尾+助詞:〓,…など (3)後処理:〓 5.公開済みのWeb辞典の延べ利用回数:14117回(2008年4月2日現在)
|