Budget Amount *help |
¥3,200,000 (Direct Cost: ¥3,200,000)
Fiscal Year 2005: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2004: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2003: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Research Abstract |
今年度は,前年度に対象としたインターネット上の言語データとしての名詞と述語による慣用表現の例を,その中身を踏まえてより詳細に調査した.前年度では,インターネット上に存在する誤用の調査をし,人間が誤用をするパターンを調査分析し,誤りのタイプとその原因を分類した.今年度はこの調査対象の数え方を単純なWWWの検索エンジンによる検索ヒット数とせずに,実際に上位50位ほどのサイトを調べ,本当に誤用として使用されているか,誤用ではなく記述上の工夫であるか,などより詳細な割合の調査を行った.また,調査対象のテキストが官公庁や企業など,比較的公共性のあるものであるか,個人に代表される私的なものであるか,または,文体が書き言葉的であるか,話し言葉に近いものであるかなど,情報源の違いによる語の使われ方の違いを調べることにも注力した.語のイメージによって誤用が生まれるかどうかを探るための資料を収集した一方で,インターネット上の情報にはかなりの偏りがあり,言葉によっては,そのインターネット上での使用傾向が一般的な言語の傾向とは言いにくい,という素朴な感触を確かめる結果が見られた.情報源としてインターネット上の文書を用いる研究が多い中で,情報源を吟味することの重要性がデータから見えてきた.語感の決定にインターネット上のデータを定量的に用いるとすると,1つの有効なデータの洗練基準として,情報源の分布の一般性を考慮する必要があることが再認識された.つまり,WWWをコーパスとみたてることはテーマによってはそれほど気軽に行えるものではなかった.また,他の試みとして,テキストの読者による感情移入の対象としての物語文内の登場人物や動物などのキャラクタを認識し,基本的にそれぞれのキャラクタの境遇やキャラクタの容姿,感情に対する描写に掛かる修飾語の語感を元に,読者の感じるイメージを推定するためのデータ整備も行った.今後,物語文内の感情を視覚的に表現する研究を目指しており,そのためのデータとしても発展させていく予定である.
|