2009 Fiscal Year Annual Research Report
多変量文体分析モデルによる近代英語散文の通時的コロケーション研究
Project/Area Number |
20520439
|
Research Institution | Osaka University |
Principal Investigator |
田畑 智司 Osaka University, 大学院・言語文化研究科, 准教授 (10249873)
|
Keywords | コロケーション / スタイル / 統計 / 多変量解析 / コーパス / ディケンズ / 文体論 / Visualisation |
Research Abstract |
平成21年度は,以下(1)~(3)の仕事を遂行した(一部は現在も継続中)。 (1) コーパスのエンコーディング、情報付与に関する研究 前年度に構築したコーパス(Osaka Reference Corpus for HIstorical/Diachronic Stylistics,略称ORCHIDS)のエンコーディング法についてさらなる研究を行った。具体的には,国際会議Digital Humanities 2009にてエンコーディングを専門とする研究者から受けた助言をもとに,TEI(Text Encoding Initiative)の最新規格P5 Guidelinesを参考にしつつ,コロケーション研究に最適化した情報付与法の検討>実験>再検討というプロセスを繰り返し,手法の精緻化を進めた(現在も継続中である)。 (2) XML対応の分析ツール開発 上に述べたTEI P5に対応した分析ツールの開発を行った(Perlおよび統計解析言語環境Rによる分析アルゴリズムの効率化作業を含む)。 (3) コーパスに基づくパイロットスタディ ORCHIDSに基づき,他項月のキーワードと共起する語彙項目の共起関係を視覚化する分析方法論を開発した。特に年度の後半は,ネットワーク分析や対応分析などの視覚化アルゴリズムを用いたデータ分析を進めた。これまでに得られた分析結果は,共起語を変数としたアプローチが,著者識別や,作品執筆年代のグルーピング,共時的記述にも有効であることを示すものであった。18世紀サブコーパス,19世紀サブコーパスとの比較により,Dickensを特徴づけるコロケーションの特徴を抽出した研究成果の一部は,Digital Humanities 2009, PALA2009(国際文体論学会)などの国際会議の他,日本英語学会シンポジウム「これからのコロケーション研究」においてもパネリストの一人として発表した。
|
-
-
-
-
-
[Presentation] More about gentleman in Dickens2009
Author(s)
Tomoji Tabata
Organizer
Digital Humanities 2009 : The 21st Joint International Conference of the Association for Computers and the Humanities, and the Association for Literary and Linguistic Computing, and the ADHO
Place of Presentation
University of Maryland, College Park, MD, USA
Year and Date
20090622-20090625