研究課題/領域番号 |
16K02697
|
研究機関 | 麗澤大学 |
研究代表者 |
千葉 庄寿 麗澤大学, 外国語学部, 教授 (70337723)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 言語学 / コーパス言語学 / フィンランド語 / 可視化 / 学習者コーパス |
研究実績の概要 |
本研究は,現代フィンランド語の大規模コーパスに基づく語彙の使用パターンの重なりをネットワークとして可視化し,語彙間のつながりを総合的に描出する「多層的語彙ネットワーク」(MDLN)の分析をおこなうことである。平成28年度はMDLNの研究体制の整備と基礎となる語彙のネットワーク的記述に関する先行研究の調査とおよびデータベースの構築・記述・分析のための技術的側面の調査を中心とした情報収集をおこなった。 1. MDLNの実験的な記述のための語彙の検討をおこなった。学習者むけのフィンランド語辞典ConLexisをベースとして語彙の選出することとし,意味的な「好み」の予備的分析をおこなった。ConLexisがもつ類義語・反意語・共起語情報の本研究への活用についても検討した。 2. 語彙ネットワークの構築に関し,専門知識を得るためDSALT (ESSLLI 2016)に参加し,研究者と情報交換をおこなった。またテクスト言語学の文脈による語彙意味論の分析方法を学ぶためLinC Summer School and Workshop in Systemic Functional Linguisticsに参加し研究者と意見を交換した。 3. 国際フィンランド語学習者コーパスの日本版(ICLFI-japan)構築の準備作業をおこなった。コーパスの構築と公開に関連し,フィンランド語学習者コーパスICLFIおよびLAS2 (フィンランド語上級学習者コーパス)の専門家と研究打ち合わせをおこなった。コーパスデータの収集はWebベースでおこなうこととし,フィンランド語の入力ページの翻訳および協力者への事前了解事項および収集する作文データの内容を確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究における中心的な課題である,語彙ネットワークから得られたベクトル化された特徴量を重層的に比較分析するという手法について,分析手法の再検討をおこなう必要性があることが判明している。今年度の調査において語彙ネットワーク構築のためのモデルを検討するため専門家と情報交換をおこなった際,本研究が想定している語彙の類似度の多層的比較という手法は現在おこなわれている分散意味論のモデルのもつ射程とはかなり異なることが明らかになった。同様に,可視化するための技術的なポイントについては語彙ネットワークの多次元空間を2次元化のための事例を多数の収集することができたが,主成分分析による情報の縮約がもたらす問題は本研究のもつ多層的視点と大きく関っており,可視化が上記の方法論的な問題への解決となるかといった点を含め,今後も注意深く研究を進めたい。 一方で,本研究で構築した語彙ネットワークの応用実験のための言語データの収集については,今年度口語フィンランド語,および学習者のフィンランド語の専門家と充分な検討をおこなうことができた。本研究で実施する学習者コーパスの収集については,次年度前半から収集を開始するべくシステムの準備をすすめており,進捗はほぼ予定どおりである。
|
今後の研究の推進方策 |
語彙ネットワークの設計と分析の枠組みの検討を引き続きおこない,MDLNのプロトタイプを構築して予備的な分析をおこなうことで本研究の初期の成果を得る。語彙ケットワーク構築のためのデータベースの設計については,現在の分析手法の再検討をおこなったうえで取りかかることになる。 コーパスから得られる意味情報の記述に関しては選定した語彙による予備的分析をおこない,研究成果として先行して公開することとする。 学習者コーパスの構築準備をすすめ,コーパスの収集を開始する。学習者コーパスの専門家を招聘しコーパスデータの構築と分析に関する作業を集中しておこなう(招聘のための渡航・滞在費用の本研究課題に含めない)。
|
次年度使用額が生じた理由 |
サーバ導入に関し,研究の進捗から本年度の導入には至らなかった。
|
次年度使用額の使用計画 |
今後サーバの導入を検討するが,研究成果公開用のレンタルサーバと実験用サーバを兼ねるVPSサーバの導入も検討したい。
|