2012 Fiscal Year Research-status Report
語彙分類の理論的整備に基づくシソーラスの改良に関する研究
Project/Area Number |
24520520
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | National Institute for Japanese Language and Linguistics |
Principal Investigator |
山崎 誠 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (30182489)
|
Co-Investigator(Kenkyū-buntansha) |
田島 毓堂 愛知学院大学, 文学部, 名誉教授 (20082349)
山元 啓史 東京工業大学, 留学生センター, 准教授 (30241756)
柏野 和佳子 大学共同利用機関法人人間文化研究機構国立国語研究所, 言語資源研究系, 准教授 (50311147)
内山 清子 国立情報学研究所, コンテンツシステム開発室, 特任研究員 (20458970)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | シソーラス / 語彙分類 / 語彙体系 |
Research Abstract |
2012年11月に海外の研究協力者も含めた研究会を行った。そこでは、語彙分類の原理について、シソーラスを氏利用した研究の展開、従来のシソーラスの持つ問題点などを中心に検討した。 シソーラスの改良については、分類語彙表(増補改訂版、2004)をデータとして、以下のような具体的な問題点を指摘した。(1)言語単位の長さと意味分類の問題(複合語、慣用句、ことわざなどの長い言語単位全体について意味番号を付与しようとする際の難しさ)。(2)荻野綱男(1993)で指摘された問題について(上位語の意味特性を下位語が継承しない問題、「欧米」「花鳥」のような合わせ呼び関係の語は上位下位関係になじまない)。(3)新語を追加する際に番号に空きがなく、番号の付け替えや対応表が必要になること。 具体的なシソーラスの改良案としては以下の2つを提案した。(1)「寒い」という形容詞は単独の語として「寒暖」「快・喜び」に、慣用句として「貧富」「多少」に、計4箇所に現れている。テキストの意味解析に使うに当たっては、これらの多義のうちどの意味で使われたかを決めなければならないが、その手間を省くために、辞書で示されているように、基本義でシソーラス上の代表する位置を示すと便利である。(2)旧版分類語彙表(1964)もまだ利用されており、これまでそれを利用した蓄積もある。そのため、旧版と増補改訂版の対応表を作り、提供することにより、学会に対する貢献ができると思われる。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究会の開催日程が秋になり、それ以降の実質的な作業にとりかかるのが遅れたこと、また、主要なデータである分類語彙表増補改訂版のデータべースをその著作権者である国立国語研究所から提供してもらうための手続きに時間がかかっているため(現時点ではデータの提供はなされていない)。
|
Strategy for Future Research Activity |
当初の目的のひとつであある、語彙分類のための理論的枠組みの整備を進める。具体的には、(1)言語単位の長さと意味との関係に基づく意味分類のあり方、(2)意味分野の粒度の問題、(3)語彙体系の変化に対応する動的語彙分類のための理論、(4)語彙分類が依拠すべき意味記述理論の検討などである。 上記と同時に、シソーラスの改良の試行を行う。語彙分類の事例として日本語研究でもっともよく利用されている『分類語彙表増補改訂版』を対象にした試行版を作成し、公開する。具体的には、多義語の整理、頻度情報、語種情報、言語単位情報、旧版との照合情報等の付与を施すことである。
|
Expenditure Plans for the Next FY Research Funding |
報告書『語彙分類の原理とシソーラス改良のための試案』を平成26年度前半にまとめ、それに関する知見を日本語学会、情報知識学会等で発表する。また、改良を加えた『分類語彙表増補改訂版』データはWEB上で研究用として無償で公開する予定である。
|
Research Products
(6 results)