研究課題/領域番号 |
23K00563
|
研究機関 | 中京大学 |
研究代表者 |
宮内 佐夜香 中京大学, 文学部, 教授 (30508502)
|
研究期間 (年度) |
2023-04-01 – 2028-03-31
|
キーワード | 近世語 / 尾張洒落本 / コーパス |
研究実績の概要 |
近世日本語の資料として貴重である尾張洒落本のコーパス化作業をやや予定よりも遅れながらも順次進め、本研究課題実施期間中の完成、公開の見通しは立っていると言える。 すでに全体のテキストデータ化は終了し、XMLによる構造化も全体の50%程度完了している。現状これらのデータ自体を公表するには至っていないが、このうち、近世尾張方言の様相をよく反映し、かつテキスト量の多い資料である『舞(実際は人偏に舞)意鈔(まひいせう)』(1801年成立)をサンプルとして高精度の構造化データを作成し、各種の作業の見通しを立てた。この高精度データ作成とともに、その他の資料の構造化作業も通して、XMLに必要な要素の検討を実施し、先行研究で提案され、既存のコーパスで実装されている要素の再評価や不足要素の洗い出しを行ってた。また、尾張洒落本コーパスに単語情報を付与するに当たって適した形態素解析辞書はどのようなものかを検討するために、高精度データに対して既存の複数の形態素解析辞書によって解析を試行し、適した辞書を策定した。さらに、全体のテキストデータを利用した文法的特徴分析の試行も実施し、近世語文法研究への活用の見通しを検討した。以上のコーパス化計画や進捗状況、各種試行の結果、および本研究計画の意義について公表するために、2024年1月が期日であった日本語学会2024年度春季大会の発表に応募し、審査を経て3月に採用が決定した。2024年6月2日の左記大会2日目のポスター発表にて発表を予定している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
上半期にはコーパス化候補の尾張洒落本作品を選定し、補助金を利用してテキストデータ化を業者に外部委託したが、委託先との打合せの結果、想定していたよりも作業時間が多く必要であることが分かった。そのため、夏季休暇期間からの作業を予定していたXMLによる構造化作業が下半期からの開始となった。その後は研究代表者と雇用したアルバイト作業者によって順次XML化を進めており、コーパス化候補15作品のうち、アルバイト作業者による整備作業は50%程度完了した。応募時の想定では年度末に一通りの構造化作業を終えることを目途としていたが、2024年度夏期頃が作業終了予定となった。以上のように数ヶ月の遅れが発生したことにもとづき、「(3)やや遅れている。」と判断した。
|
今後の研究の推進方策 |
やや遅れは見られるものの、それは「現在までの進捗状況」で述べたとおり作業の本格始動の時期の遅れであり、その後の作業自体は順調に進んでいる。そのため全体の研究計画を半期送らせることとし、計画を見直した。 直近の具体的計画としては、2024年度上半期はXML化の完成を目指し、応募当初は上半期から実施予定であった形態論情報付与の作業は2024年度下半期中の着手を予定する。また、試行版コーパスの公開ついては2024年度中を予定していたが、これについても2025年度の公開を目指す。その際の公開対象は15作品全体ではなく、とくに尾張方言の様相を反映していると見なされる一部の作品にターゲットを絞って作業を優先的に実施し、第1次の公開を目指す。公開方法に関しては、2024年度中に研究協力者から可能な方法について情報提供を受け、具体的な検討の開始を予定している。
|
次年度使用額が生じた理由 |
作業の遅延によってアルバイト作業者の労働時間が当初の予定より減少したこと、参加学会がオンライン開催であったことによって旅費の支出がなかったこと、計画の見直しにより、専門的知見を得るための謝金の支出がなかったこと、図書資料の購入がなかったことが、次年度使用額が生じた理由である。 これについて、2024年度中に、2023年度に購入できなかった図書資料の購入に使用する。また、計画の見直しによって遅らせていた、専門的知見を得るための専門家とのミーティングを2024年度中に実施し、謝金として使用する予定である。
|