研究概要 |
本研究課題では,特に語彙ギャップ(ある言語における語彙に直接対応する語彙が別の言語において存在しないという現象)に注目することにより,概念語彙化の言語による差異を分析・記述するための方法論を明らかにすることを目的とする.本年度は,下記の2点について取り組んだ. ●語彙資源がサービス化されている環境において,漸進的に対応付けられていく異言語の語彙概念により形成される多言語の意味ネットワークを,近年注目を浴びているLiiked Dataの考え方によって構造化するモデルを提示し,多言語セマンティックWebに関する国際ワークショップ(MSW2011,ドイツ・ボン市,2011年10月23日)で発表した.この情報構造化モデルにおいては,全体としては語彙ギャップを呈する状況においても,その要素間に対応付けを行うことができる場合の表現を含んでいる. ●日本語と英語を対象に,それぞれの語彙資源における語彙概念を対応付けるために有効な情報,および,それを用いた実際の対応付け方式の検討を進め,実験的な評価を行った.その結果,語彙概念を規定する同義語集合の対応付けにおいて,目的言語における語義タグ付きコーパスを用いた曖昧性解消が有効である一方,語義の定義・説明文を用いた異言語間のテキスト類似性を用いる方法は,最適なパラメータを決定することが自明ではないという知見を得た.この結果を意味的な語彙資源であるWordNetに関する国際会議(GWC2012,松江市,2012年1月10日),および,国内学会の研究会・年次大会において発表した.
|