研究課題/領域番号 |
21K18367
|
研究機関 | 東海大学 |
研究代表者 |
成田 広樹 東海大学, 文学部, 准教授 (60609767)
|
研究分担者 |
大関 洋平 東京大学, 大学院総合文化研究科, 講師 (10821994)
松林 優一郎 東北大学, 教育学研究科, 准教授 (20582901)
窪田 悠介 大学共同利用機関法人人間文化研究機構国立国語研究所, 研究系, 准教授 (60745149)
|
研究期間 (年度) |
2021-07-09 – 2024-03-31
|
キーワード | オープンアクセスデータベース / 容認性判断 / 理論言語学 / シンタクス/統辞論 / 意味論 |
研究実績の概要 |
2023(令和5)年度は、前年度に開発したプレ公開版システムについて、テストユーザーからのフィードバックを詳細に検討しながら、検索機能の拡充およびユーザーの投票機能の拡充を行うとともに、表示ユーザーインターフェイスのデザイン調整を行った。 一定のアップデートを加えたプレ公開システムをもとに、言語処理学会第28回年次大会 併設ワークショップJED2022.「日本語における評価用データセットの構築と利用性の向上」分科会に参加し、瀧田健介・窪田悠介・成田広樹の3名共同研究「GrammarXiv:言語理論・事実のインタラクティブ・データベースの開発」を発表した。 また、当発表、プロトタイピングチームのサンプルエントリ登録作業、および分担者窪田悠介の神戸大学集中講義などで得られたユーザーからのフィードバックも踏まえ、開発アップデートを行い、version0.4.0を開発した。特にLaTeXと同等の数式表現能力を備え、かつ言語学論文によくつかわれるアノテーションを簡易に記述するための独自の記法を開発した(GramTeXと命名した)。また、プロトタイピングで検討を重ねてきた検索結果のグラフ表示機能を新たに本システムに追加し、表示ユーザーインターフェイスのデザイン調整を行った。 さらに、専門の弁護士に法律相談を行い、著作権法、個人情報保護法等への法令遵守の観点からデータベースの利用規約およびプライバシーポリシーの策定を行った。また、研究期間内の法令遵守における課題の洗い出しを行った。 サンプルエントリ登録も順次進め、報告書作成時の2023/5/17時点で登録エントリ総数は23,418件となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
プロジェクト科研申請当初から予定していた2022(令和4)年度目標である「テストユーザーによる使用を主にしたα版開発」、「サンプル入力体制の拡充」、「有志研究会の発足」を概ね達成することができた。 チームでの入力サンプル登録数は昨年度末時点での6,778件から大きく前進し、総計23,418件となったが、これはウェブ公開α版およびそれに接合する形で開発されている入力インターフェイスのプロトタイプシステムとの併用によるチーム検証が実を結んだ結果である。 また、一定のアップデートを加えたプレ公開システムをもとに、言語処理学会第28回年次大会 併設ワークショップJED2022.「日本語における評価用データセットの構築と利用性の向上」分科会に参加し、瀧田健介・窪田悠介・成田広樹の3名共同研究「GrammarXiv:言語理論・事実のインタラクティブ・データベースの開発」を発表することができた。 次年度のウェブβ版(プレ公開版)開発リリースに先駆けて、必須の作業であった利用規約・プライバシーポリシーの日本国対応版策定についても、著作権法、個人情報保護法などに詳しい弁護士法人STORIAと綿密に相談し、本年度中に完成することができた。そして、著作権法、個人情報保護法への法令対応について、公開版リリース前に必要な作業についての明確な見通しを得ることができた。
|
今後の研究の推進方策 |
2023(令和5)年度は研究計画の最終年度であり、前年度の公開準備作業を通じて洗い出された課題を解決しながら、期間内にウェブ公開版の開発・公開を行うことを目標とする(ただしβ版とし、ユーザーからのフィードバックを受けて正式公開版への改定は次年度以降の作業とする見込みである)。 公開版へ向けて、前年度までに受けたテストユーザーからのフィードバックを綿密に検討し、ユーザーの真偽評価アクションの仕組みを確立することで、インターフェイスの表現力と利便性をより頑強なものにする。特に、理論-仮説-データの演繹論理関係を、柔軟に、しかし十分な表現力を持って登録できる入力インターフェイスを策定する。また、ユーザーからのフィードバックを綿密に検討しつつ、コメント・ディスカッションの仕組みの仕様を確定し、ソーシャル・ネットワーキング機能の開発を行う。 また、科研費プロジェクト内に立ち上げたコンプライアンスチームは、個人情報の第三者提供という観点から個人情報委員会へオプトアウトの登録をすすめる。また、プライバシーポリシー・利用規約の英訳及び各国法案に対応するための修正を行う。 ウェブβ版の公開と前後して、関連学会やワークショップ等での研究発表に順次取り組んでいく。2023年度には国際ワークショップCurrent Issues in Comparative Syntax 2: Boundaries of Ellipsis Mismatchにて招待講演を行う予定である。 そして、公開版をもとに、学会発表やシステムデモ論文の出版を目指す。
|
次年度使用額が生じた理由 |
データベースの開発に関わる経費については、按分を設定した上で当該助成金以外からの捻出が可能となっているが、本年度に特に本助成金にて開発を予定していた文献情報データのマスターデータベースの整備、およびソーシャル・ネットワーキング機能(エントリに対するコメント・ディスカッションスレッド機能)については、追加の要件定義の作業が必要となったため、発注を次年度に繰り越すことになった。 その一方で、むしろ次年度に計画していた利用規約・プライバシーポリシーの策定については、適正な法律相談の機会を得ることができ、一部策定を前倒しして本年度に行うことができた。 著作権法・個人情報保護法に対する各国対応についてかなり明確な方針を得ることができたことは非常に重要な進展であった。
|