Creation of an Open Access Database for Linguistic Theories Based on an Integral Analysis of Elliptical Structures in English and Japanese
Project/Area Number |
23K20467
|
Project/Area Number (Other) |
21H00532 (2021-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2021-2023) |
Section | 一般 |
Review Section |
Basic Section 02080:English linguistics-related
|
Research Institution | Tokai University |
Principal Investigator |
成田 広樹 東海大学, 文学部, 准教授 (60609767)
|
Co-Investigator(Kenkyū-buntansha) |
松林 優一郎 東北大学, 教育学研究科, 准教授 (20582901)
瀧田 健介 同志社大学, 文学部, 教授 (50632387)
窪田 悠介 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 准教授 (60745149)
折田 奈甫 早稲田大学, 理工学術院, 准教授 (70781459)
|
Project Period (FY) |
2021-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥16,900,000 (Direct Cost: ¥13,000,000、Indirect Cost: ¥3,900,000)
Fiscal Year 2025: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2024: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
Fiscal Year 2023: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2021: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 言語学 / オープンアクセス・データベース / 文法 / 省略 / 削除 / 容認性判断 / 言語理論 / オープンアクセスデータベース / 省略/削除 / 理論言語学 / シンタクス/統辞論 / 意味論 |
Outline of Research at the Start |
本研究は、言語事例-仮説-理論の包括的記述を一元管理し、オープンアクセスの、柔軟なエントリ間リンクが可能な、ソーシャルネットワーキングサービス(SNS)機能付きのデータベースGrammarXivを開発提示する。構築の出発点として、特に日英語の省略構造研究の分野を題材に取 り、当該分野における理論データの合目的的・理論横断的な参照機会を言語研究コミュニティ全体に提供することで、透明性の高い研究を支え 、隣接分野との学際的研究を促進する基盤を創出する。
|
Outline of Annual Research Achievements |
2023(令和5)年度は、前年度に開発したプレ公開版システムについて、テストユーザーからのフィードバックを詳細に検討しながら、検索機能の拡充およびユーザーの投票機能の拡充を行うとともに、表示ユーザーインターフェイスのデザイン調整を行った。 また、一定のアップデートを加えたプレ公開システムをもとに、言語処理学会第28回年次大会併設ワークショップJED2022.「日本語における評価用データセットの構築と利用性の向上」分科会に参加し、瀧田健介・窪田悠介・成田広樹の3名共同研究「GrammarXiv:言語理論・事実のインタラクティブデータベースの開発」を発表した。 当発表、プロトタイピングチームのサンプルエントリ登録作業、および分担者窪田悠介の神戸大学集中講義などで得られたユーザーからのフィードバックも踏まえ、開発アップデートを行い、version0.4.0を開発した。特にLaTeXと同等の数式表現能力を備え、かつ言語学論文によくつかわれるアノテーションを簡易に記述するための独自の記法を開発した(GramTeXと命名した)。また、プロトタイピングで検討を重ねてきた検索結果のグラフ表示機能を新たに本システムに追加し、表示UIのデザイン調整を行った。 さらに、専門の弁護士に法律相談を行い、著作権法、個人情報保護法等への法令遵守の観点からデータベースの利用規約およびプライバシーポリシーの策定を行った。また、研究代表の成田と分担者の折田と共同でコンプライアンスチームを立ち上げ、研究期間内の法令遵守における課題の洗い出しを行った。 サンプルエントリ登録も順次進め、報告書作成時の2023/5/17時点で登録エントリ総数は23,418件となった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
プロジェクト科研申請当初から予定していた2022(令和4)年度目標である「テストユーザーによる使用を主にしたα版開発」、「サンプル入力体制の拡充」、「有志研究会の発足」を概ね達成することができた。 チームでの入力サンプル登録数は昨年度末時点での6,778件から大きく前進し、総計23,418件となったが、これはウェブ公開α版およびそれに接合する形で開発されている入力インターフェイスのプロトタイプシステムとの併用によるチーム検証が実を結んだ結果である。 また、一定のアップデートを加えたプレ公開システムをもとに、言語処理学会第28回年次大会併設ワークショップJED2022.「日本語における評価用データセットの構築と利用性の向上」分科会に参加し、瀧田健介・窪田悠介・成田広樹の3名共同研究「GrammarXiv:言語理論・事実のインタラクティブデータベースの開発」を発表することができた。 次年度のウェブβ版(プレ公開版)開発リリースに先駆けて、必須の作業であった利用規約・プライバシーポリシーの日本国対応版策定についても、著作権法、個人情報保護法などに詳しい弁護士法人STORIAと綿密に相談し、本年度中に完成することができた。そして、著作権法、個人情報保護法への法令対応について、公開版リリース前に必要な作業についての明確な見通しを得ることができた。
|
Strategy for Future Research Activity |
2023(令和5)年度には、昨年度の公開準備作業を通じて洗い出された課題を解決しながら、年度内にウェブβ版の開発・公開を行う。また、ユーザーの真偽評価アクションの仕組みを確立することで、インターフェイスの表現力と利便性をより頑強なものにすることを目指す。 また、これまでにUI設計の検証が済んでいる理論枠組みエントリ、トピックエントリ、仮説エントリ、データエントリに加えて、実験系論文のデータ取り込みのための実験エントリの仕様を新たに決定し、いくつかのサンプルデータの入力を行う。 ウェブβ版の公開と前後して、関連学会やワークショップ等での研究発表に順次取り組んでいく。2023年度には国際ワークショップCurrent Issues in Comparative Syntax 2: Boundaries of Ellipsis Mismatchにて招待講演を行う予定である。 そして、科研費プロジェクト内に立ち上げたコンプライアンスチームは、個人情報の第三者提供という観点から個人情報委員会へオプトアウトの登録をすすめる。また、プライバシーポリシー・利用規約の英訳及び各国法案に対応するための修正を進める。 2024(令和6)年度には、理論-仮説-データの演繹論理関係を、柔軟に、しかし十分な表現力を持って登録できる入力インターフェイスを策定する。また、ユーザーからのフィードバックを綿密に検討しつつ、コメント・ディスカッションの仕組み(ソーシャル・ネットワーキング機能)の仕様を確定し、アップデートを経て最終的なウェブ公開版にこぎつけることを目標とする。 2025(令和7)年度には、公開版ユーザーからのフィードバックを詳細に検討し、さらに利便性・機能性・表現力に関する拡充を行うとともに、学会発表やシステムデモ論文の出版を目指す。
|
Report
(2 results)
Research Products
(8 results)