2007 Fiscal Year Annual Research Report
情報集約に必要な文脈と名詞の属性を考慮した動詞の多義性解消モデルの構築
Project/Area Number |
19500122
|
Research Institution | Okayama University |
Principal Investigator |
竹内 孔一 Okayama University, 大学院・自然科学研究科, 講師 (80311174)
|
Keywords | 語彙意味論 / 述語項構造 / 格関係 / 語義付与コーパス / 語義 / 文脈依存性 / 語義あいまい性解消 / 意味役割 |
Research Abstract |
本年度は動詞の文脈依存性を明らかにするため,動詞および名詞の語義付与コーパスの構築を行った.語義付与作業を行うために,1語義付与単位,2語義付与対象の基準を明らかにした.動詞の多義性解消の目標から1に対しては複合語内を分割した形態素の単位に付与すること,2に対しては京都大学コーパスを対象に頻度が多く,かつ多義性が3以下のものを選択することで作業者に負担をかけずに初期段階での構築を早めることができた.語義付与作業の結果,96の動詞の各語義に対して10文程度の用例である1107文に対して,正確な係り受け解析結果,動詞の語義(動詞項構造シソーラス(http://cl.cs.okayama-u.ac.jp/rsc/data/で公開中)),名詞の語義(分類語彙表ならびに日本語語彙大系の語義),名詞の意味役割の付与を行うことができた.現段階では作成したデータの見直しを行っている.見直しが終わり次第公開を予定している.語義付与データの作成によって,動詞の語義の事例が増えることで動詞の意味辞書(動詞項構造シソーラス)では不足していた動詞の語義が発見されて辞書の修正に貢献することができた.これは当初のねらい通り辞書(動詞の意味の定義)と連動したタグ付きコーパスを構築することで,より確度の高い言語資源を構築するという予想に即した結果が得られたことを意味する.一方,成果発表として言語処理学会年次大会での発表以外に辞書構築と結びつけた研究の方向性が評価されて平成20年3月に開催された言語処理学会年次大会でチュートリアル講師として招待講演に招かれた.これは結局,日本語で本研究が提案している述語項構造まわりのタグ付与データが多く存在しないこと,英語圏を含めても大規模に辞書と同時に構築している研究がきわめて少ないことが理由にあげられる.こうした状況から,次年度では作成した語義付与コーパスをより拡大させて公開することを予定している.
|
Research Products
(1 results)