2013 Fiscal Year Research-status Report
言語名ゆれと系統分類ゆれを考慮した世界言語系統分類の類似性判定アルゴリズムの開発
Project/Area Number |
23650129
|
Research Institution | Yamaguchi University |
Principal Investigator |
松野 浩嗣 山口大学, 理工学研究科, 教授 (10181744)
|
Co-Investigator(Kenkyū-buntansha) |
乾 秀行 山口大学, 人文学部, 准教授 (10241754)
呉 靭 山口短期大学, 情報メディア学科, 講師 (70708015)
|
Keywords | 文字情報 / 言語系統分類 / 文字列照合 |
Research Abstract |
昨年度までは言語名の類似度、言語系統分類の類似度、言語総合類似度などの概念の定量化およびそれらを用いて、2つの言語系統木に含まれる同一言語の検出アルゴリズムの開発をしてきた。その手法では、パラメータの値設定が重要なポイントとなる。今年度は、まず今まで提案した手法におけるパラメータの値設定に関し、実験方法および詳しい手順などを整理し、明確化にした。 次に言語名の類似度について考察を加え、その定量化手法の改善案を提示した。今までの提案した手法による実験結果の考察を通して、その手法では言語名の類似度が過小評価されている場合があることに気付いた。このことは言語名の類似度の定量化手法には改善の余地が残されていることを意味し、また同時に、もしその改善を果たすことができれば、それまでの同一言語ペアの検出率92.3%という結果をさらに向上させる可能性があるということでもある。なぜならば、言語系統分類の類似度や言語総合類似度などの類似度のいずれも、言語名の類似度をもとに定義されているためである。今までの提案した言語名の類似度の手法の問題点についてに検討し、新しい定量化手法を提示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成25年度は昨年度提案した手法におけるパラメータの値設定の方法についての検討及び言語名の類似度の定量化手法の改善を目標に取り組んできた。提案手法のパラメータの値 設定に関し、実験方法および詳しい手順などを整理し、平成26年1月に国際学会において発表した(この発表は「Best Paper Award」 を受賞している)。 言語名の類似度の定量化手法の改善については、データ調査を行い、問題点を指摘し、それをもとに新しい定量化手法の案を提示し、研究紀要にて報告を行った。今後は、提示した定量化の案に基づいて実験を行い従来手法による結果とを比較検討し、同一言語の検出率向上につながる改善案となっているかどうかについての検証を行なう。これにより、言語名の類似度の定量化手法の改善を行い、研究目標に向かってさらに作業を継続する。これに加えて、最近提案された新手法の導入の検討も開始しており、そのためにも、研究期間の延長申請を行った。次年度もこれらの課題に対応するため研究を継続する。
|
Strategy for Future Research Activity |
今後は、提示した新しい言語名の類似度の定量化手法についての実験を行い、実験結果を出したうえで、従来結果との比較検討を行い、同一言語の検出率の向上の可能性を試みる。 また、言語と方言の扱いの違いによる言語の同一性判定上の問題についても取り組んで行く予定である。これは過去においても課題として挙げていたが、検出率の向上という観点からは言語名の類似度の定量化手法の改善がより重要な意義をもたらすであろうと判断したため、このことを後回しをすることにした。今後はこの点についても研究を展開していきたい。
|
Expenditure Plans for the Next FY Research Funding |
最近、言語系統分類の新たな手法がLars Bolinらによって提案され、この方法は我々の手法と関連しており、研究をさらに推進できる可能性がある。この手法の導入を検討したところ、我々の計算手法の見直しなど大きな作業が発生し、平成25年度に終了することができないことが明かとなった。そこで、この新手法についての研究を実行するため、計画を変更し、平成26年度も延長して研究を継続することにしたため、次年度の使用額が生じた。 (1) Bolinらの手法の詳細な調査、(2)それに伴うデータ整理、さらに、(3)研究会等での発表に予算を使用する。なお、研究代表者の松野(山口大)と研究分担者の乾(山口大)は(2)及び(3)を実施するために予算を使用し、研究分担者の呉(山口短期大)は、(1)と(3)を実施するために予算を使用する。
|
Research Products
(2 results)