2015 Fiscal Year Research-status Report
ドイツ詩テキストデータベースを用いた比喩の枠組語としての都市インフラ関連語の研究
Project/Area Number |
26370402
|
Research Institution | Kagoshima National College of Technology |
Principal Investigator |
保坂 直之 鹿児島工業高等専門学校, その他部局等, 教授 (80280501)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | ドイツ / 詩 / テキスト / データべース / 表現主義 / 比喩 / インフラ / ベルリン |
Outline of Annual Research Achievements |
前年度までに処理した二つのアンソロジーにCを加えて、都市インフラ関連語彙リストを拡充する作業が進んだ(C: Grossstadterfahrung. In: Lyrik des Expressionismus. Tuebingen 1999. ) 。unixコマンドを使って出現語彙を塊化し、重要語彙の拾い出しを行った。詩語のテキストファイル資料全体を拡充する作業については、二つのDVD資料(Daten Deutscher Dichtung. www. Zeno. org. / Deutscher Lyrik von Luhter bis Rilke. Ditigal Bibliothek.)からのデータの取り込みと整形を継続中である。現時点で詩のファイル総数は11.541、総語数は5,731,424であり、大きさとしては詩語に特化したコーパスとして比較作業に使えるものになったため、トラークルの詩テキストを入れた各フォルダやA、B、Cアンソロジーとコンコーダンサー(AntConc)を使って比較する作業を始めた。 鉄を使った自由な造形などの20世紀初頭のインフラ施設に注意が払われず、インフラ関連語彙が詩語になりにくい問題については上記のリストと照らしあわせながらBenn, Stadler, Boldt, Hyme, Blass, Kernerなどの詩から地下鉄、鉄路、路面電車などに言及するものを取り上げて解釈作業をし、インフラ関連語彙の使用傾向を論文化する準備を進めた。 テキストデータベースの文学研究の応用方法の検討についてはトラークルの作品群のデータを引き続き用いて、第2詩集第2連作『孤独な人の秋』の構成を他の連作詩群との使用語彙の比較で検討して口頭発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
テキストデータベースの拡充作業は順調に進んで当面十分なファイル数になったが、若干ではあれ文字コードをunicodeにしていないファイルの文字化けの問題があり、その解決のためにファイルの重複の解消作業を留保してある。今後はこの作業と併せてホームページ等で公開できる形にデータを整える必要がある。 収集したデータを使ってwie比喩のイメージ語との共起関係を一つ一つ見ていく計画だが、一方でコンコーダンサを使って語群と語群を比較する方法もある。例えばテキストデータベース全体を大コーパス、フィルタリングに使っているアンソロジーの語彙集を小コーパスとして、大小のコーパスを比べながら小コーパスに特徴的な語彙を拾い出すなどである。ツールを使ったやり方の有効性を確認したいが、語彙数の少ない小アンソロジーでははっきりとした結果が見えないため、ベルリン州立図書館で入手したアンソロジーのファイルを用いたが、pdfファイルをOCR処理した後の手作業での修正に時間を取られた。当初の計画にはなかったコンコーダンサを使った作業にどこまで精力をさくべきか、見極める必要がある。 整形したデータの著作権処理については専門家と相談し、KOTONOHA(現代日本語書き言葉均衡コーパス)の事例にならって著者の著作権がない作品データであっても著作権者(ドイツの版元になる)と交渉して公開の承諾を得る方針が妥当、という結論になった。そのため、データを一般公開する準備と並行して、この著作権処理を急ぐ必要が生じている。データベース研究としての進捗が遅れた場合に備えて、トラークルのZyklus研究をデータ処理の手法を使いながら進めている。
|
Strategy for Future Research Activity |
1 表現主義アンソロジーテキストデータ(A、B、C)からBahn, Bahnhof, Eisen, Berlinなどのキーワードでファイルを集約して作成した語彙群を使って、インフラ関連語彙の詩語や共起するwie比喩イメージの語を増やしてリストを増強する作業をさらに進める。また、その語彙群と詩語のテキストデータベース全体とをコンコーダンサを使って比較して語彙群の特徴語を拾い出し、リストと比較検討する。この結果を踏まえながら、Benn, Stadler, Boldt, Hyme, Blass, Kernerなどの詩の解釈に基づく表現主義の詩におけるインフラ語彙の扱いについて論文発表する。また、検索に関わる作業そのものについても口頭発表して成果報告する。 2 本研究期間後の研究の方向を見定めるために、1の計画に支障がない限りにおいて以下の作業も並行して行う。(1)コンコーダンサを使って表現主義アンソロジーのデータをテキストデータベース全体と比較し、A、B、Cの特徴語を拾いあげる。(2)同様の方法でベルリンのアンソロジーのデータD、Eをそれぞれテキストデータベース全体と比較して、Dの特徴語、Eの特徴語からD、Eの傾向を比較検討する(D: Grossstadt Lyrik. Hg. von H. Moeller. 1903 Leipzig. / E: Pinthus, Kurt: Menschheitsdaemmerung. Hg. von K. Pinthus. 1920 Hamburg.)。 3 テキストデータベースを整える作業(ファイルの重複などへの対応)は一旦中断して現状での利用を目指す。版元と交渉して著作権処理の作業を進め、コーパスデータを公開しているさまざまなWebサイトのスタイルを検討するが、ある程度未整形での研究データとしてのデータ公開を目指す。
|
Causes of Carryover |
人件費の差額により、1703円の残が生じた。
|
Expenditure Plan for Carryover Budget |
次年度の消耗品購入費に充てる。
|