2023 Fiscal Year Annual Research Report
Develpment of a Method of Text Encoding for Japanese Historical Texts Accoding to Methdological Commons
Project/Area Number |
23H03696
|
Allocation Type | Single-year Grants |
Research Institution | International Institute for Digital Humanities |
Principal Investigator |
永崎 研宣 一般財団法人人文情報学研究所, 人文情報学研究部門, 主席研究員 (30343429)
|
Co-Investigator(Kenkyū-buntansha) |
間淵 洋子 和洋女子大学, 人文学部, 准教授 (10415614)
岡田 一祐 慶應義塾大学, 文学部(三田), 准教授 (80761220)
中村 覚 東京大学, 史料編纂所, 助教 (80802743)
後藤 真 国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (90507138)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | 東アジア古典籍 / 日本古典籍 / テキスト構造化 |
Outline of Annual Research Achievements |
2023年度の本研究の実績としては、TEI協会東アジア/日本分科会の定例研究会をオンラインで共催し、ほぼ毎週、49回にわたり、東アジア/日本に関するテキスト構造化に関する議論と実践を行った。 定例研究会においては、TEI (Text Encoding Initiative)ガイドライン及びODDの日本語訳、方言談話資料の協働マークアップが主なテーマとなるとともに、オンライン開催のため国内外各地でテキスト構造化に取り組む研究者・実践者が集い、テキスト構造化に関する活発な議論が展開された。 この活動をベースとしつつ、日本の歴史的テキストの構造化に関する取り組みが進められた。以下に、テキストのタイプ毎にみてみよう。 和歌に関しては、近代短歌、歌合及び虫歌合に関する取り組みに協力する形でテキスト構造化のルールが検討され、それを踏まえた統合ビューワ及び個別対応のビューワの双方の開発が進められた。この成果はTEI国際会議、じんもんこんシンポジウム等で発表された。 近代文学の草稿に関しては、テキスト構造化に関する議論と個別対応の専用ビューワの開発が行われ、これもドイツ・パーダーボルンで開催されたTEI国際会議で発表された。 古辞書に関しては、歴史的辞書の構造化ガイドラインであるTEI-lex0のプロジェクトを率いるToma Tasovacを招聘してワークショップを開催し、議論を深めた。 また、歴史史料全般に関して、RDFとテキスト構造化との関係について検討するとともにこれもTEI国際会議で発表した。 仏典に関するテキスト構造化も議論し、情報処理学会人文科学とコンピュータ研究会や日本印度学仏教学会で共同発表を行った。 以上の構造化実践を踏まえ、本年1月に汎用のTEI古典籍ビューワをWeb公開し、誰もが気軽にテキスト構造化に取り組める環境を提供した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
そのために日本を含む東アジアの古典籍に対応しようとしてきた。なかでも、テキスト構造化のターゲットとしていた分野として、和歌に関する議論をかなり深めることができた。これ以外にも、近代文学草稿、仏教文献、古辞書、歴史史料などのタイプのテキストに関して議論を進めることができ、そのうちのいくつかのタイプについてはそれぞれに定義した構造に基づくビューワを開発し、そこでの表示に至るまで対応し、国内外各地の研究集会で発表を行うことができた。さらに、これに対応する東アジア古典籍向けの汎用ビューワの開発と公開を実現できた。これにより、テキスト構造化の意義をわかりやすく示すことができるようになった。そして、これに対するフィードバックも収集し発表することができたため、今後のさらなる展開につながることになった。 さらに、これを発展させる形でAI-OCRと構造化テキストとの自動対照の仕組みを開発した。これは不完全なAIを信頼できるデジタル学術基盤に組込んでいくための手法として非常に有効なものであり、これは国内外各地の研究集会で発表しただけでなく、2023年4月にはウィーン大学での関連国際シンポジウムにて招待講演を行い、それぞれに様々な反響を集めた。
|
Strategy for Future Research Activity |
今後の研究の推進方策としては、対応するテキストのタイプの拡充、既存のタイプのテキストに関するさらなる探究、それらに基づくビューワの機能追加を進めていく。 テキストのタイプに関しては、2023年度に議論を行った古辞書に関する構造に本年度は特に力を入れる。ビューワに関しても、古辞書向けのものはこれまでとはまったく異なるものになり、すでに古辞書ビューワは国内外の研究プロジェクトによって開発されているため、そうしたものを参照しつつ互換性のある形で開発を進めていく。 一方、資料画像との対応に関してIIIF対応画像との連携を行う。これにもテキスト構造に関する議論とビューワ開発における検討が必要になるため、その両面から研究開発を進めていく。 最終年度には国際シンポジウムを開催して本研究の成果を広く公表する予定である。
|
-
-
-
-
[Journal Article] 日本語方言談話資料のTEIによる構造化の試み2023
Author(s)
中川奈津子, 岡田一祐, 永崎研宣, 北﨑勇帆, 王一凡, 曹芳慧, 藤原静香, 塚越柚季, 乙川文英, 小川潤, 片倉峻平, 左藤仁宏, Wenlu Wang, 石田友梨, 宮川創, 佐久間祐惟, 塩井祥子, 井上慶淳, 村瀬友洋, 関慎太朗, 田良島哲, 嵩井里恵子, 渡邉眞儀, 中町信孝, 幾浦裕之
-
Journal Title
じんもんこん2023論文集
Volume: 2023
Pages: 83-90
Peer Reviewed
-
-
-
-
-
-
-
[Presentation] Teaching Encoding In and Out of the Classroom2023
Author(s)
Jakacki, Diane / Croxall, Brian / Jenstad, Janelle / Crompton, Constance / del rio Riande, Gimena / Nguテェ Um, Emmanuel / Cummings, James / Duguid, Timothy / Nagasaki, Kiyonori / Scholger, Martina / Viglianti, Raffaele
Organizer
Joint MEC TEI conference 2023
Int'l Joint Research
-
-
-
-
-
-
-
-
-
[Presentation] Multilingual taxonomy initiative - TaDiRAH as community of practice2023
Author(s)
Borek, Luise; Hastik, Canan; Dombrowski, Quinn; Broeder, Daan; Rockenberger, Annika; Nagasaki, Kiyonori; Mochizuki, Ryo; Katakura, Shumpei; Cupar, Drahomira; Ohmukai, Ikki
Organizer
Digital Humanities 2023
Int'l Joint Research
-
-
-
-
-
-