研究課題/領域番号 |
25330383
|
研究機関 | 大阪大学 |
研究代表者 |
三宅 真紀 大阪大学, 言語文化研究科(研究院), 准教授 (80448018)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 類似度分析 / テキストマイニング |
研究実績の概要 |
H26年度は、前年度に引き続いて、校訂本の類似度計算に基づきながら、校訂本間の差異について比較を行った。分析対象とするテキストは、前年度と同様に、ギリシャ語の校訂本として、Nestle-Aland第27版、Westcott-Hort(1881)版、von Soden(1913)版、Scrivener(1894)版を使用した。さらに、欽定本KJVなどの英語版についても類似度計算を行った。その結果、ギリシャ語の校訂本においては、大半の部分が共通している文章から、わずかな差異の部分を抽出する手法が求められたのに対して、英語版においては、語彙のバリエーションや解釈の違い等から生じられる、圧倒てきな差異の多さが確認された。今後の課題として、翻訳版のテキストを扱う際の統計手法についての検討を行う予定である。 また、校訂本のテキスト間の差異を視覚化するWebアプリケーションの開発も進めた。テキスト間の類似度を分析する手法は、編集距離から測る方法と、単語のベクトル空間モデルから計算する方法を実装した。類似度計算はRで行っているため、RのWebアプリケーション用のパッケージであるShinyを利用して開発を行った。テキストの類似度比較にあたっては、文(節)単位の比較を行い、テキスト全体の類似度を俯瞰的にみることのできるマクロ的な機能と、一文内をngramで区切って小さな範囲においてテキストの違いを動的に確認する機能の2種類を用意し、マクロ的・ミクロ的な分析を可能にしている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
H26年度は、テキスト間の差異を視覚化するWebアプリケーションの開発に集中したため、当初の予定であった分析テキストの拡張まで進むことができなかった。
|
今後の研究の推進方策 |
H27年度は、類似度比較分析のテキストの範囲を拡大し、福音書以外のジャンルにおいての校訂本間の差異について調査を行う。
|
次年度使用額が生じた理由 |
当初購入予定だった図書の変更のために差額が生じた。
|
次年度使用額の使用計画 |
前年度購入予定だった図書に代えて、研究進捗状況により適した内容の図書を購入予定である。
|