研究課題/領域番号 |
23K00746
|
研究機関 | 広島大学 |
研究代表者 |
河本 健 広島大学, 図書館, 特任教授 (50224861)
|
研究分担者 |
竹内 浩昭 静岡大学, 理学部, 教授 (90216854)
石井 達也 神戸市立工業高等専門学校, その他部局等, 准教授 (90845603)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
キーワード | 英語論文 / コーパス分析 / 論文執筆支援 / 科学論文 / n-gram / webプラットフォーム |
研究実績の概要 |
本研究では、生命科学分野のトップジャーナル30誌に掲載された300編の英語論文のテキスト(約150万語)を集めて分析を行い、論文執筆を支援するためのプラットフォームの制作を目指す。生命科学論文は、通常、Introduction、Materials & Methods、Results、Discussionの4つのセクションで構成されている。論文の流れをより明確に分析するために、この4つのセクションのそれぞれを、その内容によって3つに分割し、合計、12個のMoveに分割したコーパスを作成して、CasualConcを用いて分析を行った。それぞれのMoveにおいて、全体コーパスと比べて統計学的に有意に高頻度で使われる語(keyword)および2から6語からなる語連鎖(n-gram)を抽出した。抽出したn-gramから、論文執筆において有益である特徴的なフレーズを集めて、意味や用途によって分類した。分類にあたっては、Moveの下位構造として、Stepを設けた。Stepには、必要に応じてsub-stepも設定した。 集めたフレーズ(約1500フレーズ)を活用するための論文執筆プラットフォーム:(webサイトhttps://home.hiroshima-u.ac.jp/tkawamo/ExperimentalCorpusTop.html)を作成して、現在、テスト運用中である。各フレーズをクリックすると、ライフサイエンス辞書コーパスでの検索を自動的に行うことができる。これは、ライフサイエンス辞書に実装されている機能を活用するものである。これによって、各フレーズの実際の使用例を確認することができる。また、ライフサイエンス辞書の英和にもリンクがはってあるので、そちらで意味や用法を確認することもできる。今後、ライフサイエンス辞書プロジェクトと連携を図りつつ、利便性を高めていきたい。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
コーパスのCasualConcによる分析は、ぼぼ完了した。さらに、webプラットフォームのパイロット版も作成し、テスト運用を開始したため。
|
今後の研究の推進方策 |
テスト運用中のパイロット版のwebプラットフォームを実際に使ってみて、バグを見つけて修正する。また、CasualConcによる文政を再検討し、webプラットフォームに収録するフレーズの再検討を行う。必要があれば追加し、収録フレーズのさらなる充実を図る。また、webプラットフォームに論文執筆の流れなどを解説したページを追加して、有用なコンテンツになるよう工夫する。成果を論文にまとめる準備を行う。
|
次年度使用額が生じた理由 |
海外の学会での発表を計画していたが、準備が整わず延期したたため。また、システム構築の外注を計画していたが、うまくプランがまとまらなかった。書籍の購入も、予定より大幅に少なくなった。令和6年度に以下のことを行う。海外での学会報告。書籍の購入。システム開発。
|