研究課題/領域番号 |
21K18372
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 立命館大学 |
研究代表者 |
赤間 亮 立命館大学, 文学部, 教授 (70212412)
|
研究分担者 |
西浦 敬信 立命館大学, 情報理工学部, 教授 (70343275)
山路 正憲 立命館大学, 衣笠総合研究機構, 研究員 (00899049)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 形態素解析 / UNIDIC / 古典籍 / 古文書 / 翻刻 / 翻刻支援 / 変体仮名 / 音声入力 / 自動変換 / 形態解析 |
研究開始時の研究の概要 |
歴史的典籍・古文書の翻刻デジタルアーカイブを進める上で、AI画像認識を使った自動翻刻技術が進展しているが、その正答率はいまだ十分ではなく、100%正確なテキストアーカイブが課題となってきている。本研究では、その一つの方策として、熟練者の解読能力を活用し、かつ熟練者の負担を出来る限り軽減して翻刻テキストを作成するため、熟練者の読上げ音声を、読み上げ時の本文テキスト情報以外のノイズを極力軽減して、電子テキスト化し、立命館ARCの初心者の育成・教育ができる「翻刻支援システム」とを連携させ、ツールの一つとしてシステムに加え、従来の翻刻量を圧倒的に凌駕するシステムを開発する。
|
研究成果の概要 |
歴史的典籍・古文書の翻刻デジタルアーカイブを進める上で、AI画像認識を使った自動翻刻技術が進展している一方、古文書解読の能力を持つ人材は、高齢者が多く、キーボード入力が苦手な場合が多い。本研究では、解読能力を持つ人材に文書を読み上げてもらい、その音声により翻刻本文の「原稿」を記録するシステムの開発を行った。立命館大学ARCの古典籍ポータルをシステム基盤として、システムを組み込み、読み上げデータの記録保存が可能にすることができた。一方、画像認識と同様に、漢字仮名交じり本文としての正解率は、高くなく、現状では「粗稿」としての役割となっており、校正用原稿としての実用性にとどまる。
|
研究成果の学術的意義や社会的意義 |
本来日本語で書かれている古典籍や古文書を解読しようというモチベーションは、多くの人が持っており、そうしたモチベーションを活用したSNS型翻刻サイトとして「みんなで翻刻」は、著名なシステムとなっている。一方、オンラインでの翻刻作業を苦手とするが、長年の経験により解読能力が極めて高い人材を、古い文献の解読プロジェクトの協力メンバーとして参加してもらうことで、翻刻効率は大幅に向上できる。コンピュータシステムを使って翻刻本文アーカイブを試みる若手研究者と高い能力を有する高齢者とのコラボレーションを有効に機能させるシステムができたことは大きな意義があろう。
|