研究概要 |
本研究では,「語感(ある「言葉」が人に与えるイメージやニュアンス)が」情報伝達(コミュニケーション)に及ぼす影響修辞的影響を計算機によって計算する語感の認知モデルの構築を目指している. 本年度は,名詞の語感を決定する周辺文脈データの自動取得と判定手法のモデル化を目指し,WWWを対象に,名詞(主として固有名詞)を与えると,その名詞を含むWWWのページを取得するプログラムの作成を行った.さらに,当該のWWWページ中から目的の名詞を含み,かつ,係り受け関係にあると判断できる文を抜き出すプログラムの作成も行っている.これはWWWをコーパスとみたてたKWICに該当するものであるが,WWWページの選び出しにGoogle APIを利用することで,小規模な研究機関においても豊富なインターネット上の資源を活用できる現実的な実装が行えている.これらにより,文脈データを取得できる.今後辞書とリンクさせて語感の決定を試みる予定である.一方で,取得した情報の日本語としての信頼性が研究を進める上で問題となることが明らかになってきた.現在,収集できるデータには誤用などにより,一般的に正しいといわれる日本語でないものも含まれている.質の良い言語資源のみを使用する立場も考えられるが,言語においては誤用が定着し,新たな意味や語感が生まれることはよくあるため,究極的な正解というものは決定しにくい.また,日常生活においても誤りを含む言語によってコミュニケーションは成り立っているという側面もある.そのため,どの程度の誤りは語感の決定に用いることが妥当であるか調査する必要が出てきた.そこで,本年度の後半では,名詞と述語による慣用表現を例にあげ,インターネット上に存在する誤用の調査をし,人間が誤用をするパターンを調査分析し,誤りのタイプとその原因を分類した.今後この調査を参考に語感決定に有効なデータの洗練基準を考慮する予定である.
|