研究実績の概要 |
本研究は、現代フィンランド語の大規模コーパスに基づく語彙の使用パターンをネットワークとして可視化し、語彙間のつながりを多層的に記述する試みである。2022年度は構築したデータベースとその可視化アルゴリズムについて語彙ネットワーク可視化システムとして実装し、運用しているWebサーバに搭載可能なサイズのサンプルデータについて検索・表示をおこなうシステムとして試験的に運用し、研究者からのフィードバックを得た。 また、研究協力者とともに、形態統語分析の活用例として日本語の解析に取り組み、複合語を含む例文をコーパスから取得するシステムに応用し、研究発表をおこなった。 本年度の具体的な研究実績は以下のとおりである。1. データベースの解析フォーマットについて、最終的にFinnish-dep-parserによる記述に統一してデータベース構築を完了した。2. データベースを用いた語彙ネットワークの可視化について、プロトタイプのシステムをWebサーバ上に構築し、研究者からのフィードバックを得た。3. 語彙ネットワークデータベースに基づき既存辞書(Conlexis, 幡野)の記述の評価・分析をおこなった。4. 語彙ネットワークを用いた用例分析について成果発表をおこない、研究者と意見交換をおこなった。5. 日本語を母語とする学習者のためのフィンランド語学習語彙リストの開発を完了し、語彙リストを公開した。6. 日本語を母語とするフィンランド語学習者の作文データベースについて、データ構築を終了し、データの整理をおこなった。 データベースの分析アルゴリズムに関して、本研究が語彙の分散表現を構築するためのモデルとしているWord2Vecよりも優れたものが近年数多く提案されており、本研究でもアルゴリズムの高速化と分析制度の向上のための検討をおこなった。
|