2013 Fiscal Year Annual Research Report
Project/Area Number |
25284086
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
近藤 泰弘 青山学院大学, 文学部, 教授 (20126064)
|
Project Period (FY) |
2013-04-01 – 2018-03-31
|
Keywords | 言語リソース / 日本語史 / N-gram / ジェンダー / コーパス / 国際研究者交流 |
Research Abstract |
本年度は、言語リソース概念の確立のためのコーパス作成作業および論文の一部を完成した。まず、研究代表者(近藤泰弘)は、研究の基礎資料となる平安時代の日本語研究資料について、国立国語研究所共同プロジェクトとして「日本語歴史コーパス平安時代篇」を完成することができた。本研究は、プロジェクトと国立国語研究所言語資源系のコーパス開発センターとの共同研究であるが、平安時代言語リソースとして重要であると考えられる『古今和歌集』を含む代表的な文学作品を収納してあり、平安時代語研究をするためには、今後欠くべからざるツールとなるものである。研究代表者は、このコーパスの基本コンセプトの設計に携わり、国立国語研究所プロジェクトのプロジェクトリーダーとして作成に関与してきた。本コーパスの完成によって、言語リソースの構築の方法論は根本的に変革されるものと考えている。また、研究代表者は、別掲リストの論文「電子化コーパスを用いた古典語のテンス・アスペクト研究」において、連携研究者の実証した『三百六十首歌』が文法的に特異な言語リソースとして働いていることを示した。 連携研究者(近藤みゆき)は、動詞「飽かず」を核とする語彙の『源氏物語』における分布を調査した。そして、この「飽かず」を核とする語形が、『古今和歌集』においては男性中心のことばであるという従来の知見を元にして、『源氏物語』の中では、そのジェンダー的規範を守る形で表現されている女性たち(正編)と、それを破る女性達(宇治十帖)とに分かれることを示した。これによって、ジェンダー規範における「言語リソース」としての『古今和歌集』についてより明確な記述ができるようになった。この問題については2014年中に論文の形で刊行することが決まっている。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度の研究計画のうち、言語リソースに関する考察については、研究代表者(近藤泰弘)が論文2通、著書1冊(次年度刊行予定)を作成することができ(「13。研究発表」参照)、連携研究者(近藤みゆき)も、論文1通(刊行予定・印刷中)、著書1冊を刊行することができた。また連携研究者は次年度以降にもさらに1冊の著書を刊行予定である。 研究代表者は、国立国語研究所において、「日本語歴史コーパス平安時代篇」の作成に従事していたが(プロジェクトリーダー)当該年度に完成をみた。本コーパスは、現在存在する唯一の形態素解析済みの古典語コーパスである。これによって、単語単位での自由な検索を行うことができるようになった。本コーパス自体も本年度の研究の達成の一部である。また、このコーパスによって、平安時代語におけるアスペクトの様相について研究を行うことができた。このアスペクトの様相は、連携研究者による言語リソース論の一部を実証したものとなっている。また、連携研究者は、研究の電子化公開の一部として、『和泉式部日記』の注釈を、角川学芸出版よりKindleフォーマットで刊行した。『和泉式部日記』は平安時代の代表的日記文学作品であり、『古今集』の言語リソースとしての性格を研究するために欠かせないものである。『和泉式部日記』の注釈書の電子版の刊行は、日本で最初のものであり、大きな意義があると考える。また、論文においても、平安時代日本語における規範性について、研究代表者・連携研究者ともに意義ある成果を刊行した。 なお、当初目的とした、『古今集』の言語リソースとしてのデータベース化は、予定通り進行しており、形態素解析されたデータを独自に用意して、次年度からの感覚・感情タグ付けの基礎作業を終了した。以上のように、現在までのところ研究目的としている「言語リソース」の構築方法について、初年度の計画以上を達成しているものと考える。
|
Strategy for Future Research Activity |
当初の研究方針で問題なく成果が得られているため、予定通り進行する。具体的な方策としては、次のようなことを考えている。まず、「言語リソース」としての『古今和歌集』としての姿をより明確に明らかにするために、感覚・感情に関するタグ付け作業を進行する。『古今集』においても、花の落下を心情に喩える表現などがあるが、その他多くの五感による感覚や感情と景物との関わりをコーパスに記述することで、「言語リソース」としての『古今和歌集』についての理解を深めていきたい。 もうひとつの次年度の課題は、国際情報交換である。すでに本研究では、本年度、オクスフォード大学の古典語コーパス研究の成果を取り入れて研究を開始しているが、次年度もそれを継続する予定である。また、研究情報の国際発信のため、ウェブサイトを開設し、研究論文・その英訳・ソフトウェアツール・アノテーションを施したテキストの一部などを公開し、発信していく予定である。研究成果のオープンアクセスの潮流はすでに広く認められるようになっているが、本研究でも強くそれを推進していく方策である。もうひとつの方針は、ソフトウェアツールの開発である。本研究にあたっては、過去に研究代表者・連携研究者が開発した方法とツールによってN-gram分析を行っているが、N-gramによるテキスト分析は、近年ますます盛んに行われるようになっている。特に情報工学の分野では、ひとつの標準的な方法となっているが、言語学・日本語学の分野ではまだそれほど一般的ではない。今回は現在注目されているテキスト処理言語であるPythonを用いて、様々なツールを開発し、それを公開していく予定である。
|
Expenditure Plans for the Next FY Research Funding |
研究成果公表のためのWebサイトを作成する予定であったが、業者選定を慎重に行っていたこと、および、Webサイトに掲載するコンテンツ作成作業を十分に行いたかったため、次年度に延期したことがある。また、高性能パーソナルコンピュータについては、予定をしていたApple社の機種の発売が遅延したため、次年度に延期することになった。 次年度使用額の多くは研究成果公表のためのWebサイトを作成することを予定している。研究公表のためのWebサイト運営のためのサーバーレンタル代金、Webサイト設計の委託費などの支出を行う。なお、Webサイト運営のためのドメイン名などはすでに取得済みであり、ただちに作成に取りかかることができる。またその他については、高性能のパーソナルコンピュータを購入する予定である。機種についてもすでに決定済みであり、発注準備を完了している。
|
Research Products
(5 results)