2012 Fiscal Year Annual Research Report
文脈依存の意味情報を判別する機能表現抽出WEBシステムの開発と運用実験
Project/Area Number |
23320105
|
Research Institution | Kanazawa University |
Principal Investigator |
松田 真希子 金沢大学, 国際機構, 准教授 (10361932)
|
Co-Investigator(Kenkyū-buntansha) |
川村 よし子 東京国際大学, 言語コミュニケーション学部, 教授 (40214704)
森 篤嗣 帝塚山大学, 現代生活学部, 准教授 (30407209)
山口 昌也 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (30302920)
山本 和英 長岡技術科学大学, 工学部, 准教授 (40359708)
庵 功雄 一橋大学, 国際教育センター, 教授 (70283702)
|
Project Period (FY) |
2011-04-01 – 2014-03-31
|
Keywords | 機能表現 / WEB辞書 / 形態素解析 |
Research Abstract |
平成24年度は主として機能表現WEB辞書システム開発のための基礎研究を行った。機能表現WEB辞書システムについては、分担者の川村が開発した「ChutaのWEB辞書」に実装するため、ChutaのWEB辞書で用いている形態素解析器(mecab)に機能表現リストを辞書登録する作業を行った。『日本語文型辞典』に掲載されている機能表現のうちモーラ数が4以上の語約600表現とその類似表現1000表現をmecabに辞書登録した。その結果、mecabに辞書登録するだけでは機能表現が十分に抽出されず、抽出エラーが多く出現することが明らかになった。そのため、前接条件、意表記情報等を加えた形での辞書登録を再度行った結果、抽出精度が上昇することが確認された(2013年度発表予定)。また、WEB辞書のユーザビリティを高めるための様々な研究も行われた(川村2012ab)。 また、その他機能表現辞書に関連する基礎研究として、(1)機能表現の一部である複合動詞の一部(~出す/始める等)について複合動詞と構成動詞との間の意味的な共通性を数値的に表現する指標を提案し,評価実験を行った(山口2013)。また(2)分より多様なテキストであっても形態素解析器が正しく機能するために、テキスト中の文字列の出現頻度のみを用いた分割単位の自動取得の方法を提案した(岡田、山本2013)。(3)日本語学習者の使用する機能表現とレベルとの関係についても学習者コーパスをもとに研究を行った(松田、宮永、庵2013)。(4)漢語サ変動詞のスルーサセル置換に関する研究を行った(森2012)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
機能表現辞書の構築についてはおおむね順調に進展していると言える。深層格のタグ付けコーパスの完成は平成24年度中に行われる予定であったが、検討を重ねた結果、深層格に関するタグ化ルールの構築には様々な観点での検証が不可避であり、25年度にずれ込むこととなった。しかし平成25年度中には計画は全て遂行される予定である。
|
Strategy for Future Research Activity |
(1)深層格の枠組みを拡大したことより現実的で妥当性のある深層格ルールを策定した。これにより、業者へのスムーズな発注が可能となった。 (2)「あたかも~のような」のような他の表現を挟んだ形の機能表現を抽出するためのルールの策定には時間がかかることが明らかになったため、それ以外の連続した機能表現の抽出と抽出精度の向上を目指すこととした。
|
Research Products
(7 results)