研究課題/領域番号 |
15K00201
|
研究機関 | 名古屋大学 |
研究代表者 |
中村 誠 名古屋大学, 法学(政治学)研究科(研究院), 助教 (50377438)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 法令テキスト処理 / 日本法令 / ターミノロジー / 自然言語処理 |
研究実績の概要 |
本研究の目的は,語義が通時的に変化する法令用語のオントロジーを構築し,語義変化のモデル化を行うことである.法令用語は,その法令で使用する前に語釈文を用いて定義される.また,法令は社会情勢を反映して改正または廃止される.改正には定義規定も含まれることもあるため,定義語の変化と関連用語の増減を通時的に表すことができる.これを体系的に扱うことで,オントロジーを構築することが可能となる. 5段階に分けられた研究計画のうち,今年度は(1)法律コーパスの整備,(2)定義語ツールの開発,および(3)オントロジーの構築に着手した.(1)に関しては,既存コーパスの整備の目処が立たないため,一般企業が提供している法令データベースから法律の定義語部分をクローリングした.これにより,(2)のツール開発の負担が軽減され,必要なデータを入手することが出来た.また,(3)では同一法律内で定義された用語間の上位下位関係について抽出を行った.結果として,現在有効は法律から,のべ 26,661 個の定義語と 35,201 関係が得られた.関係抽出の精度は,100個のランダムサンプリングによる抽出で 88.0% であった. また,法令文の統計的機械翻訳に重要な法令用語抽出も並行して行っており,これを辞書登録することで翻訳精度が向上したことも確認できた. 本研究の成果として,2本の雑誌論文の掲載と4本の国際会議等での発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
申請書の研究計画に沿って研究を行い,それによる成果が出ていることから,おおむね順調に進展していると判断できる. ただし,法律コーパスの整備において課題が残ったため,来年度に持ち越すこととなった.その問題とは,既存コーパスの整備が困難であったことから一般企業が提供している法律データベースから法令用語の抽出を行ったが,このデータは過去15年に遡ることしかできない.したがって,長い時間で通時的変化を分析するには,既存コーパスの整備がやはり必要となる.また,その整備状況により,定義語ツールの開発を新たに行う必要が生じることが予想される.
|
今後の研究の推進方策 |
研究計画に沿って,オントロジーの構築に必要な関係用語の抽出を行う.具体的には,上位下位関係の抽出や単語間類似度によるクラスタリングから類義語の発見を行う. 次に語義変化のモデル化を検討する.これは,関連用語の増減と語義変化の関係を求めることである.新語の導入による既存単語の語義変化は言語進化の過程で頻繁に発生する現象である.ベイジアンネットワーク等の構築により,時間に対する変化率などを表す方法を検討する. これらを発信するためのウェブ構築を検討する.語義の通時的変化を表現するため,意味ネットワークのアニメーション表示等を検討する.語義変化モデルの公開に関しては,XMLデータの配布を行うことを考えている.
|
次年度使用額が生じた理由 |
本研究は,基盤研究(A)「日本法情報の即時性・理解性のある国際的発信:統計的機械翻訳に基づく支援」(H26-28, 代表:外山勝彦)(以下「外山科研」という.)と連動して行われており,外山科研に関係する経費の多くはそちらで支払われる.次年度使用額が生じた最大の理由は,コーパス整備に係る役務を外山科研の経費として支払われたことによるものである.また,ノートパソコンの購入も次年度に先送りしたことも影響している.
|
次年度使用額の使用計画 |
コーパス整備に関して今年度も引き続き役務として発注する予定である.また,GUI開発のために必要なノートパソコンを発注する.
|