研究概要 |
平成24年度の前半,昨年11月までは,現在の研究であるメタファーの処理とディバワ氏の博士論文(博士後期課程)のテーマであるユーモア処理の共通点を整理し,学会発表を行った。その後,メタファーの処理メカニズムに関する作業が本格化し,また大きな学会もなかったため,作業に集中した。 以下,平成24年度に行った研究作業の概略を具体的に述べる。(1)日本語表現大辞典(小内,2GO5)を電子化し,3万例以上のメタファーの文例を収集し,処理しやすくなるよう,文例,見出し,インデックスからなるデータに修正を施した。(2)その後,日本語の直喩のパターン(『のような』,『のように』,『みたい』,『みたいな』,『みたいに』,『同然』,『ごとく』,など),および,直喩の文例をデータから抽出した。(3)直喩のパターンを使い,直喩の文例の喩辞(ソース),被喩辞(ターゲット),共通属性(グラウンド)を,プログラムを使い自動的にとりだした。(4)喩辞,被喩辞,共通属性の3つすべてが表層表現上に現れていない直喩に対し,辞典の見出し語やインデックスを利用し,喩辞,被喩辞,共通属性のいずれかのうちで欠けている情報を,プログラムまたは手作業で補った。(5)喩辞,被喩辞,共通属性がすべてそろった直喩に対し,この三つの要素の関係をWeb,コーパス,格フレーム(京大,黒橋・河原研究室)などを使用し,出現頻度,共起頻度などを計算した。現在,その最初の段階まで実行できている。完了すれば,本研究が目標とするメタファー概念ネットワークを構成できる。(6)メタファーのsalienc eimbalanceの閾値(基準)を計算した。格フレーム等を使い,それぞれの直喩の喩辞と被喩辞の属性のリストをとりだして比較し,両方のリストに現れた項目を抽出した。項目に,直喩の共通属性または共通属性らしいものが現れたら,喩辞の属性リストと被喩辞の属性リストの中の位置を計算し比較する。たとえば,『疑問が雲のように湧く』では,喩辞が『雲』,被喩辞が『疑問』,共通属性が『湧く』となる。共通属性『湧く』の属性リスト内の位置を計算する。『疑問』の全属性の数188のうち,『疑問』側の『湧く』の位置が9(平均位置,9/188=0.048),『雲』の全属性の数123のうち『雲』側の『湧く』の位置が27(平均位置,27/123=0.220)となり,平均位置の差は0.172となる。この平均位置の差をsalience imbalanceの閾値と考える。このようにして,直喩におけるsalience imbalanceの閾値を計算する。閾値を超えればメタファーとして処理し,超えなければメタファーとして処理しない,という条件を設けることで,データ内のメタファーを実際にコンピュータが処理できるかどうかを調べた(現在もこの作業を行っている)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
研究計画立案当初は,できるところまでやってみようという挑戦的な気持ちであったが,3万を超える豊富な用例からなるデータベースを得ることができ,そのおかげで予想以上の考察ができた。喩辞,被喩辞,それらの共有属性(解釈)が表層表現上に現れる直喩だけでも数が多く,それらをもとにメタファー処理のアルゴリズムを,当初の予定通り案出し,改良を加えているところである。 まず,当初の研究計画の通り,日本語母語話者に参加してもらい,構築予定のメタファー処理システムの評価実験を行うことにしている。さらに,機械翻訳を使い英語に直喩を直訳し,英語母語話者にその妥当性を評価してもらうことも計画している。同時に,コンピュータ上でも,日本語の直喩,対応する英語の直喩のsalience imbalanceを計算し比較することで,日本語,英語の母語話者の比喩的な語彙知識の概念構造の違いを考察する予定である。
|
今後の研究の推進方策 |
重要な新しいテーマも見つかったため,本研究課題の期間内,あるいは期間後に,以下の二つのテーマも行うことにしている。(1)類似性が解釈になるメタファーだけではなく,強調のためのメタファー(たとえば,『死ぬほど愛している』)も使用頻度が多いことが分かった。そこで,強調のメタファーの処理メカニズムも今後考察していく。 (2)喩辞,被喩辞,それらの共有属性が表層表現上に現れている直喩の中に,省略のあるものが多くあり,この省略を,語彙知識(意味・概念ネットワーク)の中のメトニミーリンクを使って人が簡単に補って理解していると考えられることが分かった。そこで,省略のある直喩で使われる隣接性のパターンを整理する。
|