2021 Fiscal Year Annual Research Report
Project/Area Number |
21H03514
|
Allocation Type | Single-year Grants |
Research Institution | Tokyo University of Science |
Principal Investigator |
池口 徹 東京理科大学, 工学部情報工学科, 教授 (30222863)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 秀行 大分大学, 理工学部, 講師 (00733510)
島田 裕 埼玉大学, 理工学研究科, 助教 (50734414)
松本 朋子 東京理科大学, 教養教育研究院神楽坂キャンパス教養部, 講師 (50783601)
松浦 隆文 日本工業大学, 先進工学部, 准教授 (70579771)
保坂 亮介 福岡大学, 理学部, 助教 (80569210)
木村 貴幸 日本工業大学, 基幹工学部, 准教授 (80579607)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | 共起ネットワーク / ネットワーク / 文法構造 / Colexification / コミュニケーション最適化 / 数理最適化 / 中間言語 / 機械翻訳 |
Outline of Annual Research Achievements |
研究代表者の池口,分担者の松本,島田は,多言語を対象とした単語の共起ネットワークの大域的構造・部分構造と文法構造の関係,Colexification に基づく概念のネットワークの構造,単語ネットワークを用いた語義変化の検出に関する検討を進めた.また,19世紀後半から20世紀前半の日本の新聞データを収集解析し、日本語の変化をネットワーク解析で分析した.ネットワーク解析に付随して,データを観察することで外来語の流入や排斥の流れが把握できた.さらに,分担者の松本は,広島と長崎の原爆証言のテキストデータを収集することで,比較的似通っているはずの原爆体験が男女という性別の違いによりどのように異なった形で表現されているかを分析した. 一般的に,会話においては少数語彙で互いの意思疎通を図るべく話者間での最適化が図られる.例えば,文章に用いられている語句を出現順位とその頻度で集計すると,k番の単語の出現頻度が1/kに比例し,これはコミュニケーションの労力を最小限にしようするために生じるていると報告されている.しかし,ここでは文法機能が全く考慮されていない.この最適化とは,あるコスト関数が定義されたときにこれを最小化する行列を探索する最適化問題として定義される.研究分担者の木村と松浦隆文は,これらに関連する文献調査を進め,数理最適化問題としての定義やその解法に関する議論を行った. 研究分担者の保坂と加藤は,Google機械翻訳の2つの論文をベースとして,どのように日英西語等の中間言語を定義するかについて議論・検討している.また,加藤は,日英韓,日英馬間の翻訳においてグーグルニューラル機械翻訳機 (GNMT) 内部で生成される文脈ベクトルの定性的解析を行った.その結果,GNMTは,同じアジア圏の言語であっても言語により異なる特徴を抽出している可能性を示唆する結果を得た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題における (1) 言語データ解析によるメタ文法規則の導出,(2) 数理最適化によるメタ文法規則の導出,(3) 計算論的認知・神経科学的方法論によるメタ文法規則の導出という三つの主要な課題それぞれにおいて,適宜議論を進め,論文投稿,学会発表を行なってきている.2021年度での研究成果に基づき,すでに採録決定している原著論文が1編,投稿予定論文が1編あるだけでなく,各種の学会においても報告が決定しており,概ね順調に進展しているといえる.
|
Strategy for Future Research Activity |
研究代表者の池口,分担者の松本,島田は,引き続き,言語データ解析によるメタ文法規則の導出を目指した解析を遂行する.具体的には,多言語を対象とした共起ネットワークの構造と文法構造の関係の調査を進める.また,Colexification に基づく概念のネットワークの構造の解析については,感情との関係を定量化への進展を試みる.これらの解析結果は,2022年度において各種学会で報告することで議論を深め,それらを基に原著論文化を目指す. 研究分担者の木村と松浦は,数理最適化によるメタ文法規則の導出を目指した解析を遂行する.具体的には,コミュニケーション労力の最適化の立場からの研究を進め,従来文献の調査の追試を行うと共に多言語への応用について模索する.その際,木村と松浦が,これまでの研究により得た知見をもとに,話者間での最小化に関する数理最適化問題の定義やその解法の提案を進める予定である.また,文章で用いられる語句で構成されるネットワークを作成し,文章機能をネットワーク最適化問題とて捉えた調査を行う. 研究分担者の保坂と加藤は,計算論的認知・神経科学的方法論によるメタ文法規則の導出を目指した解析を遂行する.2021年度で得た知見を基に,多言語に対する中間言語の定義について検討を行う.2022年度は,グーグルニューラル機械翻訳機を含む多様な機械翻訳機で生成される文脈ベクトルの解析を進展させ,どのような特徴が抽出されるかについて検討を行う. さらに2022年度は,グループ内だけでなく3グループ間の打合せを,対面で実施し,プロジェクト全体としての推進を図る.
|