2021 Fiscal Year Research-status Report
Developing a linguistic archive for repeatable acceptability judgments
Project/Area Number |
21K18367
|
Research Institution | Tokai University |
Principal Investigator |
成田 広樹 東海大学, 文学部, 准教授 (60609767)
|
Co-Investigator(Kenkyū-buntansha) |
大関 洋平 東京大学, 大学院総合文化研究科, 講師 (10821994)
松林 優一郎 東北大学, 教育学研究科, 准教授 (20582901)
|
Project Period (FY) |
2021-07-09 – 2024-03-31
|
Keywords | オープンアクセス・データベース / 主語 / 削除 / 容認性判断 / 理論言語学 |
Outline of Annual Research Achievements |
本研究は、言語事例-文法仮説-文法理論にかかわる記述を一元管理するオープンアクセス・データベースGrammarXivを開発し、特に容認性判断データの再現性を確保するための方策を探究するプロジェクトである。初年度は、プロトタイプシステムの開発に着手し、成田(研究代表者)の研究実績を中心にサンプルデータを入力した。簡易プロトタイプシステムver.0.1.0については、成田が理論言語学集中講義で綿密な試用を行い、モニターユーザーの評価アクションのサンプルデータを得た。テスト試用およびチーム内検討を通じたフィードバックを踏まえ、プロトタイプシステムアップデート版ver.0.2.0を開発したのち、使用感の検証を兼ねたワークショップを2件行った。チームでの入力サンプルは年度末時点で6778件となった(うち、仮説エントリ479件、容認性判断データを主とするデータエントリ1368件、現象・トピックエントリ240件、文献エントリ1917件、関係エントリ2782件)。 また、日本言語学会第・言語系学会連合共同開催公開特別シンポジウム『データベースをつくる・つかう:課題と展望』を成田が主となり企画し、言語研究の分野における様々なデータベース開発・利用の実情を広く分野に共有した。また、オープンアクセス・データベース開発に関わる将来的課題について複数のデータベース開発者・利用者とディスカッションを行った。さらに、大関(研究分担者)が同シンポジウムにて理論言語学データベースに求められる諸条件について研究発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
仕様書の確定や開発外注業者の選定などを十分に時間をかけて行った上で、プロトタイプシステムの開発を予定通り初年度に行うことができた。また、3年度目の目標と考えていたユーザーによるエントリ評価アクション・ディスカッションなどのソーシャルネットワーキング(SNS)の機能について、かなり綿密な試用検証サイクルが必要になることが見込まれたため、初年度を通じてSNS機能についても検討を重ね、その機能の一部をプロトタイプシステムに盛り込むことができた。次年度の目標であるプレ公開テスト版(α版)の開発を見据えた順調なスタートが切れたと考えられる。 また、プロトタイピングシステムの開発状況に応じて複数のテストセッションを行い、様々な開発上の課題を洗い出すことができた。次年度以降の開発発注用の仕様書を策定する作業もチームで取り掛かることができた。
|
Strategy for Future Research Activity |
当初の研究計画で第3年度(2023年度)末に一般公開β版の開発を完了する目標を立てている。公開時にはシステム全体の仕様が一定程度確定しかつ開発が完了している必要がある。第2年度・第3年度は、より具体的にフロントエンド・バックエンド双方の仕様の詳細を詰める作業を開発と並行して行う予定である。特に第2年度(2022年度)では、期間内のプレ公開テスト版(α版)の開発完了を目指す。 データベースのサンプルエントリ入力に関しては、初年度はあえてテーマや理論の限定をせず、チームメンバーおよび少数のテストユーザーによって比較的自由にエントリの入力を進めた。これはデータベース利用における幅広いニーズを洗い出す上で必要な作業であったが、一方、本研究計画では特に容認性判断データの再現性を研究トピックに掲げているので、第2年度では特にこの研究トピックに照準を絞ったサンプルエントリ入力を並行して行うこととする。また、ユーザーインターフェイスの仕様を検討する上で必要なユーザーテスト利用の機会を確保するため、第2年度では容認性判断データをテーマにしたワークショップを企画する予定である。 また、第3年度(2023年度)のβ版公開に先駆けて、容認性判断データとそれによってテストされる理論仮説を柔軟かつ綿密に紐付けるリンク機能の開発が必須の作業となる。第2年度では、言語資料開発に豊富なノウハウを持つ窪田悠介(国立国語研究所)を新たに研究分担者に加え、データベースのグラフ表示機能の拡充にも力を入れて開発を進める予定である。
|
Causes of Carryover |
データベースの初期構成の開発に関わる経費については、按分を設定した上で当該助成金以外からの捻出が可能となった。次年度以降の集中的なデータベース入力を行うことで当該助成金の次年度使用額を活用したい。 また、サーバーの設置に関しては、物理サーバーを購入し研究代表者あるいは研究分担者の研究機関にて維持する方策を申請当初は想定していたが、その後検討を重ねた結果、クラウドソーシングによってサーバーを立ち上げることができ、設備の初期投資費用がかなり抑えられた。
|
Research Products
(5 results)