2006 Fiscal Year Annual Research Report
計量的言語使用研究のためのマルチメディア・コーパスの開発に関する基礎的研究
Project/Area Number |
18520355
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Osaka University |
Principal Investigator |
石井 正彦 大阪大学, 大学院文学研究科, 助教授 (10159676)
|
Keywords | 日本語 / コーパス / マルチメディア / 言語使用 / 計量言語学 |
Research Abstract |
本研究は、実際の言語使用場面を録画・録音した「映像・音声データ」と、そこで発話された音声言語や表示された文字言語を記録した「言語データ」とを関係づける(リンクする)ことによって、相互に双方向から検索することのできる「マルチメディア・コーパス」を試作すること、および、そうしたマルチメディア・コーパスの利用によって、大量データに基づく計量的・実証的な言語使用研究が可能になることを明らかにすること、を目的とする。本年度は、国立国語研究所の「テレビ放送の語彙調査」のデータを使用して、マルチメディア・コーパスを試作するために、以下のことを行った。 (1)「テレビ放送の語彙調査」データの「映像・音声データ」をデジタル化した。 (2)デジタル化した映像・音声データについて、標本ごとに頭出しができるよう、検索用の情報を付与した。 (3)各標本の映像・音声を30秒ごとに区切り、区切りごとに頭出しができるよう、検索用の情報を付与した。 また、以下の作業を継続した。 (4)各標本の「言語データ」(音声文字化データと画面文字データ)について、単位語ごとに、対応する映像・音声データの検索情報を付与し、単位語からそれを含む映像・音声データが検索できるよう、リンク付けを行う。 (5)各標本の言語データの単位語に付与されている、見出し語情報・品詞情報・語種情報、番組情報、話者情報、画面情報などから、該当する映像・音声データが検索・閲覧でき、必要に応じて加工できるシステムを開発する。
|