2022 Fiscal Year Annual Research Report
A study on visualizing lexical networks based on the multilayered linguistic information: a case of modern Finnish
Project/Area Number |
16K02697
|
Research Institution | Reitaku University |
Principal Investigator |
千葉 庄寿 麗澤大学, 外国語学部, 教授 (70337723)
|
Project Period (FY) |
2016-04-01 – 2023-03-31
|
Keywords | 言語学 / フィンランド語 / コーパス言語学 / 語彙ネットワーク / 可視化 / 学習者コーパス / 学習語彙集 |
Outline of Annual Research Achievements |
本研究は、現代フィンランド語の大規模コーパスに基づく語彙の使用パターンをネットワークとして可視化し、語彙間のつながりを多層的に記述する試みである。2022年度は構築したデータベースとその可視化アルゴリズムについて語彙ネットワーク可視化システムとして実装し、運用しているWebサーバに搭載可能なサイズのサンプルデータについて検索・表示をおこなうシステムとして試験的に運用し、研究者からのフィードバックを得た。 また、研究協力者とともに、形態統語分析の活用例として日本語の解析に取り組み、複合語を含む例文をコーパスから取得するシステムに応用し、研究発表をおこなった。 本年度の具体的な研究実績は以下のとおりである。1. データベースの解析フォーマットについて、最終的にFinnish-dep-parserによる記述に統一してデータベース構築を完了した。2. データベースを用いた語彙ネットワークの可視化について、プロトタイプのシステムをWebサーバ上に構築し、研究者からのフィードバックを得た。3. 語彙ネットワークデータベースに基づき既存辞書(Conlexis, 幡野)の記述の評価・分析をおこなった。4. 語彙ネットワークを用いた用例分析について成果発表をおこない、研究者と意見交換をおこなった。5. 日本語を母語とする学習者のためのフィンランド語学習語彙リストの開発を完了し、語彙リストを公開した。6. 日本語を母語とするフィンランド語学習者の作文データベースについて、データ構築を終了し、データの整理をおこなった。 データベースの分析アルゴリズムに関して、本研究が語彙の分散表現を構築するためのモデルとしているWord2Vecよりも優れたものが近年数多く提案されており、本研究でもアルゴリズムの高速化と分析制度の向上のための検討をおこなった。
|
Remarks |
研究期間中に運用したWebサーバは、ディスクスペースの関係で、データベースの全データを検索することができないため、サンプルデータのみ検索できるプロトタイプとして構築・公開している。
|