1987 Fiscal Year Final Research Report Summary
語と語の関係による知識データの収集についての基礎的研究
Project/Area Number |
61580033
|
Research Category |
Grant-in-Aid for General Scientific Research (C)
|
Allocation Type | Single-year Grants |
Research Field |
Informatics
|
Research Institution | Himeji Collage of Hyogo |
Principal Investigator |
田中 康仁 姫路短期大学, 経営情報学科, 助教授 (00163585)
|
Co-Investigator(Kenkyū-buntansha) |
西川 仙之 神戸商科大学, 商経学部, 教授 (90047457)
|
Project Period (FY) |
1986 – 1987
|
Keywords | 自然言語 / 機械翻訳 / 多義語 / 仮名漢字変換 / 同音異議語 / 意味解析 / 意味理解 |
Research Abstract |
機構翻訳システムの多義語の判別, 仮名漢字変換システムの同音異義語の判別を行うためには語と語の関係の知識データを大量に作成しなければならない. しかし, この知識データ収集についての工学的方法が十分確立されていない. このため人手に頼らざるをえない状況である. この研究では語と語の関係による知識データの収集方法の確立と基礎的研究を目的とした. 本年度の研究としては朝日新聞のデータ84日分から'を'を中心とした知識データを収集した. 'を'についてのデータは延16万件, 種類10万件のデータを得た. この内容は特定研究「言語情報処理の高度化」で3冊の本として出版した. 'が'については延べ7万件, 種類5万4千件のデータを集めることができた. この内容については昭和63年度特定研究言語情報処理の高度化で出版したい予定である. 'が'についての知識データは少ないので昭和61年1年分の朝日新聞から知識データを抽出する作業を続けており良い結果が得られつつある. 日本科学技術情報センターのKWICから'が'についての知識データを得る作業は続けているが34万行のKWICを処理するため, 今後に結果がもちこされている. 朝日新聞のデータを利用して'の'に関する知識データの抽出方法の基礎的研究を行った. 約60万行のKWICから2種類のリストを作成した. また'の'の研究より名詞の概念記述についての方法とデータが得られることが判明した.
|
-
[Publications] 田中康仁,吉田将: 第24回情報科学技術研究集会発表論文集. 151-161 (1988)
-
[Publications] 田中康仁,吉田将: 情報処理学会第35回(昭和62年後期)全国大会論文集. 1S-4. 1211-1212 (1987)
-
[Publications] 田中康仁,吉田将: 情報処理学会第36回(昭和63年前期)全国大学論文集34-10. 34-10. 1257-1258 (1988)
-
[Publications] 田中康仁,吉田将: 情報処理学会自然言語研究会報. NL-65. 1-12 (1988)
-
[Publications] 田中康仁,吉田将: ソフトウェア科学会自然言語研究会. (1988)
-
[Publications] 田中 康仁: 計量国語学と日本語処理 (秋山書店). 181-200 (1987)
-
[Publications] 田中 康仁: "語と語の関係解析用資科-朝日新聞記事データ分析-資科編(1),(2),解説書" 文部省科学研究費特完研究「言語情報処理の高度化」総括班, 850 (1987)