研究課題/領域番号 |
18H00675
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分02080:英語学関連
|
研究機関 | 大阪大学 |
研究代表者 |
田畑 智司 大阪大学, 言語文化研究科(言語文化専攻), 教授 (10249873)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
研究課題ステータス |
交付 (2021年度)
|
配分額 *注記 |
15,730千円 (直接経費: 12,100千円、間接経費: 3,630千円)
2021年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2020年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2019年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2018年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
|
キーワード | コーパス文体論 / デジタルヒューマニティーズ / 国際連携 / テクスト分析 / テクストマイニング / 国際連携基盤創成 / 機械学習 / トピックモデル / 国際連携拠点 / テクスト分析方法論 / ワードエンベディング / 文体 / 小説言語 / フォーラム / トピックモデリング |
研究実績の概要 |
まず,参照コーパスを構成するテクストのマークアップを改善するために,プログラミング言語Pythonで,テクストの構造を手がかりに,自動的に文書構造マークアップを実施するスクリプトの開発に注力した。このスクリプトの開発の結果,段落の前後を<p></p>でマークアップするだけでなく,テクスト中の引用の前後に<quote></quote>を埋め込む一方,スマートクウォートを全てダムクウォートに変換,nダッシュ,mダッシュともに<dash;/>タグに変換するほか,称号や数字の表記も統一することにより,底本テクストによるパンクチュエイションのばらつきを可能な限り最小化することを支援できるようになった。これを基に,テクストマークアップの質を高めるために推敲を進めた。並行して,トピックモデリングを文体論研究に応用するために,自然言語処理分野の先行研究を幅広く渉猟し,知識基盤の整備に努めた。この段階までの研究成果について以下のような形で発表・報告することにより,リビューを受けている。(1) 日本英文学会中国四国支部第74回大会シンポジウム「デジタル時代の英語英米文学研究と英語教育」パネル発表「確率論的トピックモデリングによるBritish classic fictionの「遠読」」(2) Western Australia Universityで開催されたBuilding Digital Humanitiesでのパネルセッション"Digital Humanities as/and computational Science"にてDHにおける機械学習について講演した。(3) フランスおよびドイツへ出張し,最新の研究情報を収集するとともに,連携拠点形成についての意見交換を行なった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究計画は新型コロナウィルスによるパンデミックにより,二度に及ぶ計画の繰越を含め,予定を大幅に変更することを余儀なくされた。国際連携基盤を形成する上では,対面でのフォーラム,会合や情報交換会が不可欠であり,本研究計画を遂行する上で極めて重要な要素であるが,連携研究機関の方針により一部対面での会合が実施できなかったことによる。ただし,講演会やワークショップをオンラインで開催するなどの工夫を施すことにより,新たな連携関係を築くための準備を継続している。
|
今後の研究の推進方策 |
国内研究機関はもとより,海外の研究機関との往来もほぼ正常な状態に戻りつつあることを鑑み,国際学術集会・国際学会での研究成果発表を加速し,機械学習に基づくコーパス文体論の国際連携基盤の整備に向けた交渉および関係構築に注力する予定である。
|