研究課題/領域番号 |
17K02525
|
研究機関 | 近畿大学 |
研究代表者 |
島 美由紀 (西尾美由紀) 近畿大学, 工学部, 准教授 (50549524)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
キーワード | 電子テクスト / TEI |
研究実績の概要 |
話法に関する計量的な研究はあるが,作家の文体的特徴を記述する研究はあまりなされていない.そこで本研究では,国際基準であるTEI(Text Encoding Initiative)のガイドラインに沿って,今年度はディケンズのOliver Twistの作品に,誰が発話しているか,聞き手はだれか,また話者および聞き手の社会階級,年齢などをタグとして,テキスト内にそれらの情報を埋め込む作業を行った.TEIを採用した理由は,個々の研究者が,自分の研究を遂行するために,独自のアノテーションを付与した電子テクストを作成して,研究しているのをよく見受けられる.しかしながら,埋め込んだアノテーションの書き方もやタグの付け方が違っている場合があり,他の研究者が作成した電子テクストと比較することが難しい.本研究では,他の研究者と相互利用可能な電子テクストを作成することを目指し,Oliver Twistのタグ付けから始めた. この研究においては,今後の研究において社会言語学的観点も考慮に入れることを考え,社会階層や年齢に関する情報ももアノテーションとしてテクスト内に埋め込むこととした.発話者,聞き手(この場合,一人ではなく,複数人いる場合,また周りにいる聴衆の場合もある),発話者および聞き手の社会階級,職業,年齢(年齢は,次の3つに分類young/adult/old),性別も加えることとした.一部判断が難しいものもあるが,現時点ではこれらのアノテーションを付与しつつ作業を進めている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
タグとして電子テクストに付与されるべき基本的な情報(書誌情報・チャプター・パラグラフ・文の切れ目など)については、すでにタグを埋め込んだ電子テクストを作成しているため,問題はないが,発話者,聞き手(この場合,一人ではなく,複数人いる場合,また周りにいる聴衆の場合もある),発話者および聞き手の社会階級,職業,年齢(年齢は,次の3つに分類young/adult/old),性別を付与していく際に,読み手の主観が入るのではないか,という懸念があった.深い読みの必要性と,その際の対応について考慮するのに時間を要した.最初に取り組む作品でルールを決めて,その後の作品におけるタグ付けを進めていくため,慎重かつ丁寧にタグ付けをする必要があったため,予定よりも時間がかかってしまった.
|
今後の研究の推進方策 |
まずは,現在作業途中であるOliver Twistの電子テクストへのアノテーションの付与作業を終わらせる.その後,統計解析環境R(tsukuba.ac.jp/bin/macosx/old/R-3.0.1.pkg)によるテキストマイニングの手法を用いて、データ分析を行い,社会言語学的観点も踏まえ,作家の文体分析につながる研究発表をする予定である.
|