2012 Fiscal Year Research-status Report
言語名ゆれと系統分類ゆれを考慮した世界言語系統分類の類似性判定アルゴリズムの開発
Project/Area Number |
23650129
|
Research Institution | Yamaguchi University |
Principal Investigator |
松野 浩嗣 山口大学, 理工学研究科, 教授 (10181744)
|
Co-Investigator(Kenkyū-buntansha) |
乾 秀行 山口大学, 人文学部, 准教授 (10241754)
|
Keywords | 文学情報 / 言語系統分類 / 文字列照合 |
Research Abstract |
研究の同一言語の検出率を向上させるために,これまでの手法を発展させることを指針とし,第一に言語系統分類の類似性評価の改善に着目し,兄弟情報を考慮した新しい言語系統分類の類似度について定義した.第二に言語総合類似度という概念を導入し,言語名の類似度と言語総合類似度に基づく言語の同一性判定の手法を提案した. 具体的には,言語名または言語系統分類の一方は完全に一致しているが,その他方の類似度が閾値に満たないため,同一言語としての判定を見逃してしまうという問題点を指摘したのちに、この問題点を分析し,語族,親,兄弟の情報を考慮した言語系統分類の類似度,さらに言語総合類似度について新たに定義した. これらの言語名の類似度と言語総合類似度を用いて,Yamamoto-Dataの言語に対し,SilGIS-Dataから同一言語を検出するための方法について述べ,アルゴリズムを与えた.さらに、言語系統分類の類似度と言語総合類似度の計算に必要なパラメータと閾値の値設定について検討をおこなった.得られた実験結果をにより、提案した手法の妥当性および有用性が確かめられた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成24年度は目標として掲げた「系統分類のゆれに対応できるアルゴリズム開発」に取り組んだ。それを実現する手段として、(1)言語名の類似度と言語系統分類の類似度の2つの尺度を同時に考慮する言語総合類似度の導入、(2)兄弟情報を考慮した言語系統分類の類似度の2を新たに導入し、これに基づいた計算機実験を行なったところ、適合率(正解数の抽出率)で98.5%、検出率(総言語数からの抽出率)は92.3%であり、以前の手法に比べて、どちらも向上させることができた。この結果を平成24年度中に人工知能学会に投稿し、平成25年2月に採択通知を受け取った。出版されたのは、平成25年4月である。 以上のことから、論文出版は平成25年度になったものの、平成24年度の研究目標はおおむね達成されたと考える。 問題として残されているのは、パラメータの値設定の方法である。提案した言語総合類似度は、パラメータの値設定に大きく左右されるため、この設定が重要なポイントとなる。この実施が必要であるため、おおむね順調に進展している、という評価とした。
|
Strategy for Future Research Activity |
提案した言語総合類似度は,パラメータの値設定に大きく左右されるところがあり,値設定が重要なポイントとなる.今後はさらなる実験を通して,アルゴリズムの調整およびより良い結果をもたらすパラメータのチューニング作業をしていく.また,今回の実験結果および考察を通して,言語と方言の扱いの違いによる言語の同一性判定上の問題点が表面化してきた.この問題に対し解決方針を定め,本手法をさらに発展させていく予定である.
|
Expenditure Plans for the Next FY Research Funding |
前年度までに約55万円の繰り越し金額があるが、平成25年4月出版の論文掲載料が約25万円であるので、実質の繰り越し金額は約30万円である。 これまでも共同して研究を実施してきた呉靱氏が新しく大学にポジションを得た。そこで、研究体制を強化するため、研究分担者としての参加を要請し、承諾を得た。平成25年度は呉氏に分担金として30万円を割り当て、研究発表旅費や研究会参加費等に使用される予定である。山口大学での使用分については、松野と乾の学会や研究会参加旅費、消耗品購入費、研究補助者謝金、論文掲載料等に使用する予定である。
|
Research Products
(2 results)