2010 Fiscal Year Annual Research Report
Project/Area Number |
19520375
|
Research Institution | Doshisha University |
Principal Investigator |
油谷 幸利 同志社大学, 言語文化教育研究センター, 教授 (50122362)
|
Co-Investigator(Kenkyū-buntansha) |
金 亨貞 同志社大学, 言語文化教育研究センター, 助教 (20457419)
|
Keywords | 外国語 / アルゴリズム |
Research Abstract |
1) 2011年3月段階で,見出し語が1万語を突破し,朝鮮語辞典としても十分な実用性を備えるにいたった。 2) 2011年3月段階で,同形異語(本来異なる語形を持つ語が,合成語を形成したり,語尾や助詞を取ることによって同形になったもの)の見出し項目が275項目となり,初級段階の朝鮮語学習者に有益な情報を提供することができた。 3) 2010年11月に至り,句単位の形態素解析を行うことに加えて,文単位での形態素解析を明示的に提示することにより,朝鮮語Web辞典利用者に対する文法学習に大きく貢献することを新たな目標として設定した.これに伴い,プログラミング言語をperlからphpおよびSQLiteに変更した。 本辞典では,従来等閑視されてきた同形異語に対する知見を形態素解析に導入してきたが,これを文単位に拡張することにより,形態素解析の精度を上げることが期待できる。現在すでに,インターネットを通して,韓日翻訳が利用できる状況が存在するが,同形異語に対する認識が低く,解釈の柔軟性に欠ける。たとえば,エキサイト翻訳では,「〓〓〓〓〓〓〓〓〓〓〓.」という入力に対して「これは食べさせてあれは鐘です。」という解釈しか提示されなかったが,「これは墨で,あれは紙です。」という解釈が文脈に最も適した翻訳であろう。
|