2020 Fiscal Year Research-status Report
A fundamental study of effective visualization and description of longitudinal changes of classical Japanese poetic vocabulary
Project/Area Number |
18K00528
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
山元 啓史 東京工業大学, リベラルアーツ研究教育院, 教授 (30241756)
|
Co-Investigator(Kenkyū-buntansha) |
ホドシチェク ボル 大阪大学, 言語文化研究科(言語文化専攻), 准教授 (10748768)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 和歌 / 分析単位 / 連接規則 / 品詞 / 二十一代集 / 結束性 / 可視化 |
Outline of Annual Research Achievements |
本研究では八台週の解析済みデータを用いて、連接規則をコンピュータ処理によって獲得した。そのデータをもとに二十一代集の解析処理に応用した。その結果、一部、多義語の処理が必要であることがわかった。多義語の処理の解決としては、従来、単語と意味を一対一として処理していたものを改め、単語には複数の意味を許容するモデルとしてトークンベースのベクトルスペースを用いて研究を進めた。その結果、頻出する単語において、複数の意味が用いられていることがわかった。一方、頻度の低い単語においては複数の意味の弁別を見つけることは難しいことがわかった。たとえば、「桜」は季節のみを述べる場合に使われていることもあれば、花の散る寂しさ・儚さを述べる場合にも使われている場合が見られた。「梅」においても「うぐいすと梅」「雪と梅」「春を待望する梅」など同じ「梅」であっても、それぞれ別のベクトルとして計算できた。従来の一対一で得られる意味より詳細な使用方法が明示的になった。 多義語処理の計算には、データベース整理をおこなった。各単語は該当するだけ複数の分類コードをつけて格納した。その分類コードのうちいずれが計算結果に対応するかで評価した。 この整理されたデータベースは、他の研究者にもつかえるようにZenodo研究リポジトリに登録し、研究資料番号(Hachidaishu vocabulary dataset Version 1.0.1 10.5281/zenodo.4744170)を得た。また、Githubにも使用解説書とともにオンラインで利用できるようにした。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
新型コロナウイルスの蔓延、緊急事態宣言の発令により、大学の授業に大きな変更があり、その準備と実施に時間が費やされ、十分に研究活動はできなかった。海外出張、研究発表を予定していたが、中止せざるをえなかった。オンライン学会もいくつかはあったが、参加できたものは2件にとどまった。
|
Strategy for Future Research Activity |
類似対のデータ収集を行う。また数理的分析、文献調査を行い、類似対・関係対の弁別を合理的に説明できるかどうかを探る。その上で、関係対のデータを古代語から得るツールと類似対・関連対の数理的特徴について比較・分析し、考察を行う。データのチェックが大きな作業となるが、謝金の配分を少々多くし、作業重点化をはかる。
|
Causes of Carryover |
新型コロナウイルスの蔓延、緊急事態宣言の発令により、大学の授業に大きな変更があり、その準備と実施に時間が費やされ、十分に研究活動はできなかった。海外出張、研究発表を予定していたが、中止せざるをえなかった。オンライン学会もいくつかはあったが、参加できたものは2件にとどまった。今後のコロナウイルスの状況を見て、可能な限り、研究活動を継続するために予算を使用する。年度余剰の予算については、オンライン参加費用、オンラインストレージ、オンラインの翻訳サービスなどに使用する計画である。
|
Research Products
(5 results)