2022 Fiscal Year Research-status Report
アイヌ語鵡川方言のフィールド調査およびデータの公開
Project/Area Number |
20K13009
|
Research Institution | Sapporo Gakuin University |
Principal Investigator |
岸本 宜久 札幌学院大学, 経済経営学部, 講師 (20848600)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | アイヌ語 / フィールドワーク / データベース |
Outline of Annual Research Achievements |
2022年度は、アイヌ語鵡川方言のフィールドワークデータのデータベース化に向けた整理作業の一環として、AI文字起こしによって生成された字幕テキストの修正を進めた。本研究課題の中心をなすデータは、2012年から2020年までのアイヌ語鵡川方言のフィールドワークデータ(音声)である。2021年度には、Amazon Web Service(AWS)を利用したAI文字起こし処理を行い、総収録時間約1,200時間の音声データに対する基礎的な字幕テキストの生成を行った。生成された字幕テキストは、字幕エディターを使用しての日本語テキストの修正およびアイヌ語の書き直し作業が必要となる。あわせて、データベース化に向けたテキストへのマークアップ作業(日本語でのセンシティブな情報やアイヌ語などへのマークアップ作業)も必要となる。今年度は、調査ファイルの約3分の1にあたる55回分の字幕テキストのファイルについて、上記の修正・書き直し処理を実行した。 また、フィールドワーク時に記録したノートの電子化とその内容の活字化を進めた。フィールドノートには、調査時の言語的・文化的な情報の記録や調査者によるイラスト記録、調査協力者によるイラストを含めた書き込みなどが含まれ、166回の調査で4,000ページを超える。データベースにおける音声データとの参照関係を構築するためには、フィールドノートの電子化および基礎的な検索可能性を付与するための文字起こしが必要である。字幕テキストの修正と並行して行っており、今年度は43回分の調査ファイルについてノートの文字起こしを実行した。 データ整理を中心とした年度となり、データを使用した具体的な成果発表に至らなかった点は反省されるが、データベース構築に向けて、残りのファイルについても計画的に作業を進める。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本年度を通じて字幕テキストの日本語テキストの修正ならびにアイヌ語の書き直しを進め、マークアップ作業を進められた点ならびにフィールドノートに対する検索可能性の付与(電子化と文字起こし)を進めた点は、データベース化に向けた進展と評価できる。 一方で、計画通りのエフォートを達成できず、上記の整理作業は遅れていると言わざるを得ない。データ整理・分析の遅延に伴い、学術論文などでの積極的な成果発信ができなかった点も、本進捗評価の理由としてあげられる。
|
Strategy for Future Research Activity |
AI文字起こしによって得られた字幕テキストをもとに、引き続き日本語テキストの修正およびアイヌ語の書き直しおよびデータベース構築に向けたマークアップを行う。あわせて、フィールドノートの整理作業も進める。アイヌ語鵡川方言のフィールドワークについても、ポストコロナの状況をみながら調査協力者と調整し、再開する予定である。
|
Causes of Carryover |
コロナ禍による学会・研究会等のオンライン開催にともない予定していた旅費の執行がなかった。次年度は現地開催の学会・研究会の増加が見込まれ、旅費としての使用ないしはそれに係る研究・調査のための物品費としての使用を予定している。
|