高機能検索方式による大規模日本語データベースの作成

研究課題

研究課題/領域番号	61880005
研究種目	試験研究
配分区分	補助金
研究分野	情報学
研究機関	東京大学
研究代表者	藤崎博也東京大学, 工学部, 教授 (80010776)
研究分担者	亀田弘之東京工科大学, 工学部, 講師 (00194994) 宮崎幸一 (株)朝日新聞社, 東京本社, 制作局局長倉島節尚 (株)三省堂, 国語辞書編集所所長田中康仁姫路短期大学, 経営情報工学, 助教授 (00163585) 荻野綱男筑波大学, 文芸・言語学系, 助教授 (00111443) MIYAZAKI Koichi Production Department, Tokyo Main Office, Asahi Shinbun Publish Company 広瀬啓吉東京大学, 工学部, 助教授 (50111472)
研究期間 (年度)	1986 – 1987
研究課題ステータス	完了 (1987年度)
配分額 *注記	9,500千円 (直接経費: 9,500千円) 1987年度: 3,000千円 (直接経費: 3,000千円) 1986年度: 6,500千円 (直接経費: 6,500千円)
キーワード	高機能検索 / 大規模日本語データベース / 言語用例検索 / 形能素解析 / 品詞情報自動付与 / 形態素解析 / 読み情報自動付与
研究概要	本研究は, 現代の日本語に関する大量の言語データをもとに, 種々の視点から豊富な言語用例を検索することのできる, 大規模・高機能な言語データべ-スを作成することを目的として, 以下のような成果を達成した. 1.言語処理用単語辞書の作成:本研究での高機能検索は, 形態素解析と品詞自動付与の言語処理に基づいており, これらの処理を行うための単語辞書を作成した. 辞書は, 計算機可読な新明解国語辞典(三省堂)・日本語単語機械辞書(九州大学)及び人名辞典等の言語資料を基に作成し, 品詞・活用情報も見出しとともに記載・利用した. 用語の活用形も見出しとして記述したので, 全体で約20万項目となった. 2.形態素解析・自動品詞情報付与アルゴリズムとそれらのプログラムの作成:日本語の品詞間の接続関係を国語学の資料を基に網羅的に調べ上げ, これを86×59接続表の形式にまとめるとともに, 文節内構造を遷移ネットワーク形式に記述し, これらの知識を利用する形態素解析・品詞情報自動付与アルゴリズムを作成し, 東京大学大型計算機上にプログラムとしてFORTRAN77で記述・実装した. 3.新聞記事データの整備:申請者らにより既に収集され, 機械可読な形態に加工されている新聞記事データ(1982年, 朝日新聞朝夕刊合計84日分)を, 高機能検索データベース用のテキストデータ(合計約30MB)として整備した. 4.高機能データベースの作成:上記の1〜3の成果に基づき, 新聞記事を対象とし, 文字・文字列・単語・単語列・品詞・品詞列及びこれらの任意の組合せをキーとする大規模・高機能な言語データベースを作成した. データベース管理システムは, 大型計算機上に, FORTRAN77を用いて記述した. この結果, 種々の観点から言語データを検索することのできるデータベースが実現された.

報告書

(2件)

1987 研究成果報告書概要
1986 実績報告書

研究成果
(18件)

すべてその他

すべて文献書誌 (18件)

[文献書誌] 藤崎博也: 情報処理学会第33回全国大会講演論文集. 1831-1832 (1986)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 藤崎博也: 情報処理学会第35回全国大会講演論文集. 1269-1270 (1987)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 藤崎博也: 情報処理学会第36回全国大会講演論文集. (1988)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 荻野綱男: 計量国語学. 16. 81-87 (1987)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 田中康仁: 情報処理学会第35回全国大会講演論文集. 1211-1212 (1987)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 亀田弘之: 情報処理学会論文誌. 28. 1103-1111 (1987)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] Organizatgion of Large Scale Japanese Text Database with advanced functions: Reports of the 33th Meeting of Information Processing Society of Japna. 1831-1832 (1986)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] Hiroya Fujisaki: "Lexical Category Analysis for a lorge-scale Japanese Text Database with Advanced Functions" Reports of the 33th Meeting of Information Processing Society of Japan. 1269-1270 (1987)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] Hiroya Fujisaki: "Morphemic and Syntactic Analysis for Constructing a Text Database with Advanced Functions" Reports of the 36th Meeting of Information Processing Society of Japan. (1988)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] Tsunao Ogino: "Methodology to Evaluate the Performance of Kna-Kanji Conversion Systems" Computational Linguistics. 16. 81-87 (1987)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] Yasuhito Tanaka: "Acquistition of Knowlledge Data by Analyzing Natural Language" Reports of the 35th Meeting of Information Processing Society of Japan. 1211-1212 (1987)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] Hiroyuki Kameda: "Classification and Retrieval System for Newspaper Information Based on a Theme - Key Concept - Key Word Hierarchy" Transactions of Information Processing Society of Japan. 1103-1111 (1987)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 亀田弘之: 情報処理学会第33回全国大会講演論文集. 1831-1832 (1986)
- 関連する報告書
  1986 実績報告書
[文献書誌] 亀田弘之: 情報処理学会第33回全国大会講演論文集. 1833-1834 (1986)
- 関連する報告書
  1986 実績報告書
[文献書誌] 荻野綱男: マイ・ワープロ. (1987)
- 関連する報告書
  1986 実績報告書
[文献書誌] 荻野綱男: 日本言語学会第93回研究発表会資料. 54 (1986)
- 関連する報告書
  1986 実績報告書
[文献書誌] 田中康仁: 情報処理学会第34回全国大会講演論文集. (1987)
- 関連する報告書
  1986 実績報告書
[文献書誌] 田中康仁: 情報処理学会自然言語研究会資料. (1987)
- 関連する報告書
  1986 実績報告書

高機能検索方式による大規模日本語データベースの作成

研究代表者

藤崎 博也 東京大学, 工学部, 教授 (80010776)

9,500千円 (直接経費: 9,500千円)

報告書

研究成果

[文献書誌] 藤崎 博也: 情報処理学会第33回全国大会講演論文集. 1831-1832 (1986)

説明

関連する報告書

[文献書誌] 藤崎 博也: 情報処理学会第35回全国大会講演論文集. 1269-1270 (1987)

説明

関連する報告書

[文献書誌] 藤崎 博也: 情報処理学会第36回全国大会講演論文集. (1988)

説明

関連する報告書

[文献書誌] 荻野 綱男: 計量国語学. 16. 81-87 (1987)

説明

関連する報告書

[文献書誌] 田中 康仁: 情報処理学会第35回全国大会講演論文集. 1211-1212 (1987)

説明

関連する報告書

[文献書誌] 亀田 弘之: 情報処理学会論文誌. 28. 1103-1111 (1987)

説明

関連する報告書

[文献書誌] Organizatgion of Large Scale Japanese Text Database with advanced functions: Reports of the 33th Meeting of Information Processing Society of Japna. 1831-1832 (1986)

説明

関連する報告書

[文献書誌] Hiroya Fujisaki: "Lexical Category Analysis for a lorge-scale Japanese Text Database with Advanced Functions" Reports of the 33th Meeting of Information Processing Society of Japan. 1269-1270 (1987)

説明

関連する報告書

[文献書誌] Hiroya Fujisaki: "Morphemic and Syntactic Analysis for Constructing a Text Database with Advanced Functions" Reports of the 36th Meeting of Information Processing Society of Japan. (1988)

説明

関連する報告書

[文献書誌] Tsunao Ogino: "Methodology to Evaluate the Performance of Kna-Kanji Conversion Systems" Computational Linguistics. 16. 81-87 (1987)

説明

関連する報告書

[文献書誌] Yasuhito Tanaka: "Acquistition of Knowlledge Data by Analyzing Natural Language" Reports of the 35th Meeting of Information Processing Society of Japan. 1211-1212 (1987)

説明

関連する報告書

[文献書誌] Hiroyuki Kameda: "Classification and Retrieval System for Newspaper Information Based on a Theme - Key Concept - Key Word Hierarchy" Transactions of Information Processing Society of Japan. 1103-1111 (1987)

説明

関連する報告書

[文献書誌] 亀田弘之: 情報処理学会第33回全国大会講演論文集. 1831-1832 (1986)

関連する報告書

[文献書誌] 亀田弘之: 情報処理学会第33回全国大会講演論文集. 1833-1834 (1986)

関連する報告書

[文献書誌] 荻野綱男: マイ・ワープロ. (1987)

関連する報告書

[文献書誌] 荻野綱男: 日本言語学会第93回研究発表会資料. 54 (1986)

関連する報告書

[文献書誌] 田中康仁: 情報処理学会第34回全国大会講演論文集. (1987)

関連する報告書

[文献書誌] 田中康仁: 情報処理学会自然言語研究会資料. (1987)

関連する報告書

藤崎博也東京大学, 工学部, 教授 (80010776)

[文献書誌] 藤崎博也: 情報処理学会第33回全国大会講演論文集. 1831-1832 (1986)

[文献書誌] 藤崎博也: 情報処理学会第35回全国大会講演論文集. 1269-1270 (1987)

[文献書誌] 藤崎博也: 情報処理学会第36回全国大会講演論文集. (1988)

[文献書誌] 荻野綱男: 計量国語学. 16. 81-87 (1987)

[文献書誌] 田中康仁: 情報処理学会第35回全国大会講演論文集. 1211-1212 (1987)

[文献書誌] 亀田弘之: 情報処理学会論文誌. 28. 1103-1111 (1987)