• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

多様な目的に適した形態素解析システム用電子化辞書の開発

計画研究

研究領域代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備
研究課題/領域番号 18061002
研究種目

特定領域研究

配分区分補助金
審査区分 人文・社会系
研究機関千葉大学

研究代表者

傳 康晴  千葉大学, 文学部, 教授 (70291458)

研究分担者 山田 篤  京都高度技術研究所, 研究部, 主席研究員 (20240004)
峯松 信明  東京大学, 大学院・新領域創成科学研究科, 准教授 (90273333)
内元 清貴  情報通信研究機構, 総合企画部, プランニングマネージャー (60358885)
小木曽 智信  国立国語研究所, 言語・資源研究系, 准教授 (20337489)
小磯 花絵  国立国語研究所, 理論・構造研究系, 准教授 (30312200)
研究期間 (年度) 2006 – 2010
研究課題ステータス 完了 (2010年度)
配分額 *注記
91,900千円 (直接経費: 91,900千円)
2010年度: 17,700千円 (直接経費: 17,700千円)
2009年度: 19,000千円 (直接経費: 19,000千円)
2008年度: 19,000千円 (直接経費: 19,000千円)
2007年度: 19,000千円 (直接経費: 19,000千円)
2006年度: 17,200千円 (直接経費: 17,200千円)
キーワード電子化辞書 / 形態素解析 / 書き言葉コーパス / 音変化 / アクセント / アクセント変化 / 辞書データベース / 単位の自動構成
研究概要

(1) 以下の特徴を持つ形態素解析辞書UniDicを設計・開発した。 ・ 「短単位」という揺れがない斉一な単位で設計 ・ 語彙素・語形・書字形・発音形の階層構造を持ち、表記の揺れや語形の変異にかかわらず同一の見出しを与えることが可能 ・ アクセントや音変化の情報を付与でき、テキスト音声合成などに利用可能
(2) 辞書データベースを構築しながら、形態素解析システム MeCab 用辞書を随時公開し、最終的に語彙素約 21 万語・書字形約 33 万語の規模と、品詞認定約 98.9%・語彙素認定約 98.6%の解析精度を達成した。
(3) さらに、辞書データベースを XML ファイル群として記述し、ユーザがカスタマイズ可能な辞書作成環境を提供する新しい方式で UniDic2 を設計・開発した。
(4) 中・長単位解析システムを含む、形態素解析の後処理ツール群を作成し、多様な目的に供した。

報告書

(7件)
  • 2010 実績報告書   研究成果報告書 ( PDF )
  • 2009 実績報告書
  • 2008 実績報告書   自己評価報告書 ( PDF )
  • 2007 実績報告書
  • 2006 実績報告書
  • 研究成果

    (108件)

すべて 2011 2010 2009 2008 2007 2006 その他

すべて 雑誌論文 (92件) (うち査読あり 24件) 学会発表 (3件) 図書 (8件) 備考 (5件)

  • [雑誌論文] 「中古和文UniDic」における言語単位の設計2011

    • 著者名/発表者名
      小椋秀樹・須永哲矢・小木曽智信・近藤明日子・田中牧郎
    • 雑誌名

      言語処理学会第17回年次大会発表論文集

      ページ: 312-315

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] Web版コーパス検索アプリケーション「中納言」の公開2011

    • 著者名/発表者名
      中村壮範・小木曽智信
    • 雑誌名

      言語処理学会第17回年次大会発表論文集

      ページ: 344-347

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 『現代日本語書き言葉均衡コーパス』における形態論情報付きXMLフォーマット2011

    • 著者名/発表者名
      小木曽智信・間淵洋子・前川喜久雄
    • 雑誌名

      言語処理学会第17回年次大会発表論文集

      ページ: 352-355

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 『現代日本語書き言葉均衡コーパス』に基づくオノマトペの分析-品詞性の検討を中心に-2011

    • 著者名/発表者名
      宮内佐夜香・小木曽智信・小磯花絵・小椋秀樹
    • 雑誌名

      言語処理学会第17回年次大会発表論文集

      ページ: 651-654

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 長単位に基づく『現代日本語書き言葉均衡コーパス』の品詞比率に関する分析2011

    • 著者名/発表者名
      冨士池優美・小西光・小椋秀樹・小木曽智信・小磯花絵
    • 雑誌名

      言語処理学会第17回年次大会発表論文集

      ページ: 663-666

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] テキストの多様性をとらえる分類指標の体系化の試み2011

    • 著者名/発表者名
      小磯花絵・田中弥生・小木曽智信・近藤明日子
    • 雑誌名

      言語処理学会第17回年次大会発表論文集

      ページ: 683-686

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 複合名詞内アクセント句境界を用いたアクセント結合予測の高精度化に関する実験的検討2011

    • 著者名/発表者名
      高野克弥・清水信哉・峯松信明・広瀬啓吉
    • 雑誌名

      日本音響学会2011年春季研究発表会講演論文集

      ページ: 363-364

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 長単位に基づく媒体・カテゴリ間の品詞比率に関する分析2011

    • 著者名/発表者名
      冨士池優美・小西光・小椋秀樹・小木曽智信・小磯花絵
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 273-280

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] BCCWJに基づくオノマトペの品詞と意味についての分析2011

    • 著者名/発表者名
      宮内佐夜香・小木曽智信・小磯花絵・小椋秀樹
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 281-288

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] Web版コーパス検索アプリケーション「中納言」のデモンストレーション2011

    • 著者名/発表者名
      中村壮範・小木曽智信
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 289-292

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 階層的形態論情報を考慮した『現代日本語書き言葉均衡コーパス』の公開用XMLフォーマット2011

    • 著者名/発表者名
      小木曽智信・間淵洋子・前川喜久雄
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 293-300

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] BCCWJに基づく中・長単位解析ツール2011

    • 著者名/発表者名
      小澤俊介・内元清貴・伝康晴
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 331-338

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] UniDicを用いた音声認識用言語モデルの作成2011

    • 著者名/発表者名
      山田篤
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 339-342

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] UniDic2:設計と実装2011

    • 著者名/発表者名
      小木曽智信・伝康晴
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 411-418

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] テキストの多様性をとらえる分類指標の構築を目指して2011

    • 著者名/発表者名
      小磯花絵・田中弥生・小木曽智信・近藤明日子
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 431-438

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] Design, compilation, and preliminary analyses of Balanced Corpus of Contemporary Written Japanese2010

    • 著者名/発表者名
      K. Maekawa, M. Yamazaki, T. Maruyama, M. Yamaguchi, H. Ogura, W. Kashino, T. Ogiso, H. Koiso, and Y. Den
    • 雑誌名

      Proceedings of LREC2010

      ページ: 1483-1486

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] 中古和文を対象とした形態素解析辞書の開発2010

    • 著者名/発表者名
      小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴
    • 雑誌名

      情報処理学会研究報告

      巻: 2010-CH-85 ページ: 49-64

    • NAID

      110008003480

    • 関連する報告書
      2010 研究成果報告書
  • [雑誌論文] Design, compilation, and preliminary analyses of Balanced Corpus of Contemporary Written Japanese2010

    • 著者名/発表者名
      K.Maekawa, M.Yamazaki, T.Maruyama, M.Yamaguchi, H.Ogura, W.Kashino, T.Ogiso, H.Koiso, Y.Den
    • 雑誌名

      Proceedings of LREC2010

      ページ: 1483-1486

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [雑誌論文] 『現代日本語書き言葉均衡コーパス』長単位解析に基づく予備的分析2010

    • 著者名/発表者名
      冨士池優美・小椋秀樹・小西光・小木曽智信・小磯花絵
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度全体会議予稿集

      ページ: 101-108

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 汎用後処理ツールを用いた短単位解析結果の再解析2010

    • 著者名/発表者名
      アブドレイム アブドハリリ・伝康晴
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度全体会議予稿集

      ページ: 141-144

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 汎用後処理ツールを用いた音変化処理の評価2010

    • 著者名/発表者名
      山田篤・渡部涼子・小木曽智信
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度全体会議予稿集

      ページ: 145-150

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] BCCWJに基づく長単位解析ツール2010

    • 著者名/発表者名
      小澤俊介・内元清貴・伝康晴
    • 雑誌名

      特定領域研究「日本語コーパス」平成22年度全体会議予稿集

      ページ: 151-156

    • 関連する報告書
      2010 実績報告書
  • [雑誌論文] 中古和文を対象とした形態素解析辞書の開発2010

    • 著者名/発表者名
      小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴
    • 雑誌名

      情報処理学会研究報告 2010-CH-85

      ページ: 49-64

    • NAID

      110008003480

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 機械翻訳に適した短単位に基づく中国語単語分割について2010

    • 著者名/発表者名
      王軼謳・内元清貴・風間淳一・Kruengkrai Canasai・鳥澤健太郎
    • 雑誌名

      言語処理学会第16回年次大会発表論文集

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 形態素解析辞書のベンチマークテスト―IPAdic・NAIST-jdic・UniDicのジャンル別精度比較2010

    • 著者名/発表者名
      小木曽智信・小椋秀樹・小磯花絵・宮内佐夜香・渡部涼子・伝康晴
    • 雑誌名

      言語処理学会第16回年次大会発表論文集

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 形態素解析辞書UniDicにおける同語異語判別について2010

    • 著者名/発表者名
      小椋秀樹・原裕・小木曽智信・小磯花絵・宮内佐夜香
    • 雑誌名

      言語処理学会第16回年次大会発表論文集

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 修辞ユニットを用いた書き言葉の分析―「書き言葉・話し言葉」と(脱)文脈化の関係―2010

    • 著者名/発表者名
      佐野大樹・小磯花絵
    • 雑誌名

      社会言語科学会第23回研究大会発表論文集

      ページ: 182-185

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] UniDic汎用後処理ツールの設計と実装2010

    • 著者名/発表者名
      山田篤・伝康晴
    • 雑誌名

      特定領域研究「日本語コーパス」平成21年度公開ワークショップ予稿集

      ページ: 23-28

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 形態素解析辞書UniDicにおける語彙素見出しの立項方針2010

    • 著者名/発表者名
      小椋秀樹・原裕・小木曽智信・小磯花絵・宮内佐夜香
    • 雑誌名

      特定領域研究「日本語コーパス」平成21年度公開ワークショップ予稿集

      ページ: 85-92

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 『現代日本語書き言葉均衡コーパス』における長単位解析の進捗状況2010

    • 著者名/発表者名
      冨士池優美・小椋秀樹・小西光・小木曽智信・小磯花絵・内元清貴・小澤俊介
    • 雑誌名

      特定領域研究「日本語コーパス」平成21年度公開ワークショップ予稿集

      ページ: 93-100

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] MeCab版形態素解析辞書4種のジャンル別解析精度比較―UniDicとIPAdic, NAIST-jdic, JUMANdic―2010

    • 著者名/発表者名
      小木曽智信・小椋秀樹・小磯花絵・宮内佐夜香・渡部涼子・伝康晴
    • 雑誌名

      特定領域研究「日本語コーパス」平成21年度公開ワークショップ予稿集

      ページ: 175-182

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] 長単位情報に基づくジャンル間の文体に関する分析2010

    • 著者名/発表者名
      小磯花絵・小木曽智信・小椋秀樹・宮内佐夜香
    • 雑誌名

      特定領域研究「日本語コーパス」平成21年度公開ワークショップ予稿集

      ページ: 183-190

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] Design, compilation, and preliminary analyses of balanced corpus of contemporary written Japanese2010

    • 著者名/発表者名
      K.Maekawa, M.Yamazaki, T.Maruyama, M.Yamaguchi, H.Ogura, W.Kashino, T.Ogiso, H.Koiso, Y.Den
    • 雑誌名

      Proceedings of the 7th International Conference on Language Resources and Evaluation (掲載確定)

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Development of an on-line word accent dictionary of Japanese2009

    • 著者名/発表者名
      H. Hirano, M. Suzuki, K. Innami, N. Minematsu, and K. Hirose
    • 雑誌名

      Proceedings of JSAA-ICJLE 2009

      巻: 24 ページ: 640-646

    • 関連する報告書
      2010 研究成果報告書
  • [雑誌論文] 多様な目的に適した形態素解析システム用電子化辞書2009

    • 著者名/発表者名
      伝康晴
    • 雑誌名

      人工知能学会誌

      巻: 24 ページ: 640-646

    • 関連する報告書
      2010 研究成果報告書
  • [雑誌論文] 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用2009

    • 著者名/発表者名
      浜辺良二・内元清貴・河原達也・井佐原均
    • 雑誌名

      自然言語処理

      巻: 16(1) ページ: 3-23

    • NAID

      10024758516

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] 形態論情報の自動付与とその問題点2009

    • 著者名/発表者名
      小木曽智信
    • 雑誌名

      国文学解釈と鑑賞

      巻: 74(1) ページ: 35-43

    • 関連する報告書
      2010 研究成果報告書
  • [雑誌論文] 多様な目的に適した形態素解析システム用電子化辞書2009

    • 著者名/発表者名
      伝康晴
    • 雑誌名

      人工知能学会誌 24

      ページ: 640-646

    • 関連する報告書
      2009 実績報告書
  • [雑誌論文] Development of an on-line word accent dictionary of Japanese2009

    • 著者名/発表者名
      H.Hirano, M.Suzuki, K.Innami, N.Minematsu, K.Hirose
    • 雑誌名

      Proceedings of JSAA-ICJLE 2009

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] An error-driven word-character hybrid model for joint Chinese word segmentation and POS tag2009

    • 著者名/発表者名
      C.Kruengkrai, K.Uchimoto, J.Kazama, Y.Wang, K.Torisawa, H.Isahara
    • 雑誌名

      Proceedings of ACL-IJCNLP 2009

      ページ: 513-521

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] Improving dependency parsing with subtrees from auto-parsed data2009

    • 著者名/発表者名
      W.Chen, J.Kazama, K.Uchimoto, K.Torisawa
    • 雑誌名

      Proceedings of EMNLP 2009

      ページ: 570-579

    • 関連する報告書
      2009 実績報告書
    • 査読あり
  • [雑誌論文] ジャンル別UniDic作成の試み, 特定領域研究「日本語コーパス」2009

    • 著者名/発表者名
      小木曽智信・伝康晴・渡部涼子
    • 雑誌名

      平成20年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 17-22

    • 関連する報告書
      2008 自己評価報告書
  • [雑誌論文] 形態論情報の自動付与とその問題点2009

    • 著者名/発表者名
      小木曽智信
    • 雑誌名

      国文学解釈と鑑賞 74(1)

      ページ: 35-43

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 話し言葉における引用節・挿入節の自動認定および係り受け解析への応用2009

    • 著者名/発表者名
      浜辺良二・内元清貴・河原達也・井佐原均
    • 雑誌名

      自然言語処理 16(1)

      ページ: 3-23

    • NAID

      10024758516

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] CRFを用いたアクセント変形予測モデルの規則処理に基づく改良2009

    • 著者名/発表者名
      印南圭祐・渡辺美知子・峯松信明・広瀬啓吉
    • 雑誌名

      言語処理学会第15回年次大会発表論文集

      ページ: 574-577

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] コーパスに基づく多様なジャンルの文体比較-短単位情報に着目して-2009

    • 著者名/発表者名
      小磯花絵・小木曽智信・小椋秀樹・宮内佐夜香
    • 雑誌名

      言語処理学会第15回年次大会発表論文集

      ページ: 594-597

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 語種を観点とした近代語と現代語の語彙の比較-形態素解析辞書「近代文語UniDic」「UniDiclを用いて-2009

    • 著者名/発表者名
      近藤明日子・小木曽智信
    • 雑誌名

      言語処理学会第15回年次大会発表論文集

      ページ: 741-744

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 現代語コーパスの利用による近代語形態素解析の精度向上2009

    • 著者名/発表者名
      小木曽智信・伝康晴・渡部涼子・近藤明日子
    • 雑誌名

      言語処理学会第15回年次大会発表論文集

      ページ: 801-804

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] ジャンル別UniDic作成の試み2009

    • 著者名/発表者名
      小木曽智信・伝康晴・渡部涼子
    • 雑誌名

      特定領域研究「日本語コーパス」平成20年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 17-22

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 『現代日本語書き言葉均衡コーパス』における形態論情報付与作業の進捗状況2009

    • 著者名/発表者名
      小椋秀樹・小木曽智信・小磯花絵・冨士池優美・宮内佐夜香・渡部涼子・竹内ゆかり・小川志乃・小西光・原裕・中村壮範
    • 雑誌名

      特定領域研究「日本語コーパス」平成20年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 57-64

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 形態論情報データベースの構成2009

    • 著者名/発表者名
      小木曽智信・小椋秀樹・小磯花絵・冨士池優美・宮内佐夜香・渡部涼子・竹内ゆかり・小川志乃・小西光・原裕・中村壮範
    • 雑誌名

      特定領域研究「日本語コーパス」平成20年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 65-70

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 短単位を対象とした連濁の処理について2009

    • 著者名/発表者名
      山田篤
    • 雑誌名

      特定領域研究「日本語コーパス」平成20年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 93-98

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 規則処理のアクセント属性を導入したCRFによるアクセント結合処理2009

    • 著者名/発表者名
      印南圭祐・峯松信明
    • 雑誌名

      特定領域研究「日本語コーパス」平成20年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 175-181

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 規則処理を参考にしたCRFによるアクセント結合モデル2009

    • 著者名/発表者名
      印南圭祐・渡辺美知子・峯松信明・広瀬啓吉
    • 雑誌名

      日本音響学会春季講演論文集

      ページ: 473-476

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] コンピュータの辞書2009

    • 著者名/発表者名
      小木曽智信
    • 雑誌名

      新「ことば」シリーズ22「辞書を知る」

      ページ: 114-117

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] Word-level dependency-structure annotation to Corpus of Spontaneous Japanese and its application2008

    • 著者名/発表者名
      K. Uchimoto and Y. Den
    • 雑誌名

      Proceedings of LREC2008

      ページ: 3118-3122

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] A proper approach to Japanese morphological analysis: Dictionary, model, and evaluation2008

    • 著者名/発表者名
      Y. Den, J. Nakamura, T. Ogiso, and H. Ogura
    • 雑誌名

      Proceedings of LREC2008

      ページ: 1019-1024

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] Word-level dependency-structure annotation to Corpus of Spontaneous Japanese and its application2008

    • 著者名/発表者名
      Uchimoto, K., Den, Y.
    • 雑誌名

      Proceedings of the 6th International Conference on Language Resources and Evaluation

      ページ: 3118-3122

    • 関連する報告書
      2008 自己評価報告書
    • 査読あり
  • [雑誌論文] A proper approach to Japanese morphological analysis: Dictionary, model, and evaluation2008

    • 著者名/発表者名
      Den, Y., Nakamura, J., Ogiso, T., Ogura, H.
    • 雑誌名

      Proceedings of the 6th International Conference on Language Resources and Evaluation

      ページ: 1019-1024

    • 関連する報告書
      2008 自己評価報告書
    • 査読あり
  • [雑誌論文] 近代文語文を対象とした形態素解析辞書・近代文語UniDic2008

    • 著者名/発表者名
      小木曽智信・小椋秀樹・近藤明日子
    • 雑誌名

      日本語学会2008年度春季大会予稿集

      ページ: 211-218

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] 話し言葉の整形作業における削除箇所の自動同定2008

    • 著者名/発表者名
      尾嶋憲治・河原達也・秋田祐哉・内元清貴
    • 雑誌名

      情報処理学会研究報告 2008-NL-185

      ページ: 85-91

    • NAID

      110006793717

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] A proper approach to Japanese morphological analysis : Dictionary, model, and evaluation2008

    • 著者名/発表者名
      Den. Y., Nakamura, J., Ogiso, T., and Ogura. H
    • 雑誌名

      Proc. of LREC2008

      ページ: 1019-1024

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Word-level dependency-structure annotation to Corpus of Spontaneous Japanese and its application2008

    • 著者名/発表者名
      Uchimoto, K. and Den. Y
    • 雑誌名

      Proc. of LREC2008

      ページ: 3118-3122

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] 『現代日本語書き言葉均衡コーパス』にもとづくジャンル間の文体差に関わる要因の分析2008

    • 著者名/発表者名
      小磯花絵・小木曽智信・小椋秀樹・冨士池優美・宮内佐夜香
    • 雑誌名

      社会言語科学会第22回研究大会発表論文集

      ページ: 192-195

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 平成19年度進捗状況報告 : 電子化辞書班(多様な目的に適した形態素解析システム用電子化辞書の開発)2008

    • 著者名/発表者名
      伝康晴・峯松信明・小木曽智信・小磯花絵・山田篤・内元清貴
    • 雑誌名

      特定領域研究「日本語コーパス」平成20年度全体会議予稿集

      ページ: 15-18

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 短単位情報に基づくジャンル間の文体に関する分析2008

    • 著者名/発表者名
      小磯花絵・小木曽智信・小椋秀樹
    • 雑誌名

      特定領域研究「日本語コーパス」平成20年度全体会議予稿集

      ページ: 99-106

    • 関連する報告書
      2008 実績報告書
  • [雑誌論文] 平成19年度進捗状況報告:電子化辞書班(多様な目的に適した形態素解析システム用電子化辞書の開発)2008

    • 著者名/発表者名
      伝康晴・山田篤・峯松信明・内元清貴・小木曽智信・小磯花絵
    • 雑誌名

      特定領域研究「日本語コーパス」平成19年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 79-84

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] 中・長単位解析システムの開発2008

    • 著者名/発表者名
      内元清貴・伝康晴
    • 雑誌名

      特定領域研究「日本語コーパス」平成19年度公開ワークショップ(研究成果報告会)予稿集

      ページ: 159-166

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] CRFを用いたアクセント結合処理に対する誤り分析とその改良に向けた考察2008

    • 著者名/発表者名
      印南圭祐・渡辺美知子・峯松信明・広瀬啓吉
    • 雑誌名

      日本音響学会春季講演論文集

      ページ: 413-414

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] 語種情報を用いた同表記異音語の解消2008

    • 著者名/発表者名
      伝康晴・中村純平・小木曽智信・小椋秀樹
    • 雑誌名

      言語処理学会第14回年次大会発表論文集

      ページ: 69-72

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] 形態素解析誤りの多い助詞・助動詞の再解析2008

    • 著者名/発表者名
      中村純平・伝康晴
    • 雑誌名

      言語処理学会第14回年次大会発表論文集

      ページ: 73-76

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] 「現代日本語書き言葉均衡コーパス」の長単位認定基準について2008

    • 著者名/発表者名
      冨士池優美・小椋秀樹・小木曽智信・小磯花絵・内元清貴・相馬さつき・中村壮範
    • 雑誌名

      言語処理学会第14回年次大会発表論文集

      ページ: 931-934

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] 形態素解析用辞書UniDicへの語種情報の実装と政府刊行白書の語種比率の分析2008

    • 著者名/発表者名
      小椋秀樹・小木曽智信・原裕・小磯花絵・冨士池優美
    • 雑誌名

      言語処理学会第14回年次大会発表論文集

      ページ: 935-938

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] CRFに基づくアクセント変形予測モデルにおけるエラー解析2008

    • 著者名/発表者名
      印南圭祐・渡辺美知子・峯松信明・広瀬啓吉
    • 雑誌名

      言語処理学会第14回年次大会発表論文集

      ページ: 969-972

    • 関連する報告書
      2007 実績報告書
  • [雑誌論文] CRF-based statistical learning of Japanese accent sandhi for developing Japanese text-to-speech synthesis systems2007

    • 著者名/発表者名
      N. Minematsu, R. Kuroiwa, K. Hirose, and M. Watanabe
    • 雑誌名

      Proceedings of ISCA Workshop on Speech Synthesis

      ページ: 148-153

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] Morphological annotation of a large spontaneous speech corpus in Japanese2007

    • 著者名/発表者名
      K. Uchimoto, and H. Isahara
    • 雑誌名

      Proceedings of IJCAI2007

      ページ: 1731-1737

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用2007

    • 著者名/発表者名
      伝康晴・小木曽智信・小椋秀樹・山田篤・峯松信明・内元清貴・小磯花絵
    • 雑誌名

      日本語科学

      巻: 22 ページ: 101-122

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用2007

    • 著者名/発表者名
      伝康晴・小木曽智信・小椋秀樹・山田篤・峯松信明・内元清貴・小磯花絵
    • 雑誌名

      日本語科学 22

      ページ: 101-122

    • 関連する報告書
      2008 自己評価報告書 2007 実績報告書
    • 査読あり
  • [雑誌論文] Morphological annotation of a large spontaneous speech corpus in Japanese2007

    • 著者名/発表者名
      Uchimoto, K., & Isahara, H
    • 雑誌名

      Proc. of IJCAI2007

      ページ: 1731-1737

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] CRF-based statistical learning of Japanese accent sandhi for developing Japanese text-to-speech synthesis systems2007

    • 著者名/発表者名
      Minematsu, N., Kuroiwa, R., Hirose, K., & Watanabe, M
    • 雑誌名

      Proc. of ISCA Workshop on Speech Synthesis

      ページ: 148-153

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] 日本語研究に適した形態素解析ソフトウェア-「unidic」と「茶まめ」-2007

    • 著者名/発表者名
      小木曽智信・小椋秀樹・伝康晴
    • 雑誌名

      日本語学会2007年度秋季大会予稿集

      ページ: 255-262

    • NAID

      110006946075

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Morphological annotation of a large spontaneous speech corpus in Japanese2007

    • 著者名/発表者名
      K.Uchimoto, H.Isahara
    • 雑誌名

      Proceedings of the Twentieth International Joint Conference on Artificial Intelligence

      ページ: 1731-1737

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 特定話者による大規模アクセントラベリングとそのデータベース化2007

    • 著者名/発表者名
      黒岩龍, 峯松信明, 伝康晴, 広瀬啓吉
    • 雑誌名

      日本音響学会2007年春季研究発表会講演論文集

      ページ: 299-300

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 日本語音声合成を目的としたアクセント処理のための規則と統計的学習2007

    • 著者名/発表者名
      黒岩龍, 峯松信明, 広瀬啓吉
    • 雑誌名

      日本音響学会春季講演論文集

      ページ: 301-302

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 平成18年度進捗状況報告 : 電子化辞書班(多様な目的に適した形態素解析システム用電子化辞書の開発)2007

    • 著者名/発表者名
      伝康晴, 山田篤, 峯松信明, 内元清貴, 小木曽智信
    • 雑誌名

      日本語コーパス(特定領域研究)(平成18年度公開ワークショップ予稿集)

      ページ: 37-46

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 「現代日本語書き言葉均衡コーパス」における短単位の概要2007

    • 著者名/発表者名
      小椋秀樹, 小木曽智信, 小磯花絵, 冨士池優美, 相馬さつき, 渡部涼子, 服部龍太郎
    • 雑誌名

      日本語コーパス(特定領域研究)(平成18年度公開ワークショップ予稿集)

      ページ: 101-108

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 単独ラベラによる大規模アクセントラベリングとそれを用いた統計的アクセント結合処理の実装2007

    • 著者名/発表者名
      峯松信明, 黒岩龍
    • 雑誌名

      日本語コーパス(特定領域研究)(平成18年度公開ワークショップ予稿集)

      ページ: 143-152

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 「現代日本語書き言葉均衡コーパス」の短単位解析について2007

    • 著者名/発表者名
      小椋秀樹, 小木曽智信, 小磯花絵, 冨士池優美, 相馬さつき
    • 雑誌名

      言語処理学会第13回年次大会発表論文集

      ページ: 720-723

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 大規模アクセントラベリングコーパスの構築とそれに基づくハイブリッド型アクセント結合処理2007

    • 著者名/発表者名
      黒岩龍, 峯松信明, 伝康晴, 広瀬啓吉
    • 雑誌名

      言語処理学会第13回年次大会発表論文集

      ページ: 724-727

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 単独ラベラによる大規模アクセントデータベースの構築およびそれを利用した統計的アクセント結合処理の検討2007

    • 著者名/発表者名
      黒岩龍, 峯松信明, 伝康晴, 広瀬啓吉
    • 雑誌名

      電子情報通信学会技術研究報告 SP2006-174

      ページ: 31-36

    • NAID

      110006248462

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Dependency-structure annotation to Corpus of Spontaneous Japanese2006

    • 著者名/発表者名
      K. Uchimoto, R. Hamabe, T. Maruyama, K. Takanashi, T. Kawahara, and H. Isahara
    • 雑誌名

      Proceedings of LREC2006

      ページ: 635-638

    • 関連する報告書
      2010 研究成果報告書
    • 査読あり
  • [雑誌論文] Dependency-structure annotation to Corpus of Spontaneous Japanese2006

    • 著者名/発表者名
      K.Uchimoto, R.Hamabe, T.Maruyama, K.Takanashi, T.Kawahara, H.Isahara
    • 雑誌名

      Proceedings of the Fifth International Conference on Language Resources and Evaluation

      ページ: 635-638

    • 関連する報告書
      2006 実績報告書
  • [学会発表] テキストの多様性をとらえる分類指標の体系化の試み2011

    • 著者名/発表者名
      小磯花絵・田中弥生・小木曽智信・近藤明日子
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋技術科学大学(愛知)
    • 年月日
      2011-03-09
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] 形態素解析辞書のベンチマークテスト―IPAdic・NAIST-jdic・UniDic のジャンル別精度比較―2010

    • 著者名/発表者名
      小木曽智信・小椋秀樹・小磯花絵・宮内佐夜香・渡部涼子・伝康晴
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京大学(東京)
    • 年月日
      2010-03-10
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] UniDic汎用後処理ツールの設計と実装2010

    • 著者名/発表者名
      山田篤・伝康晴
    • 学会等名
      特定領域研究「日本語コーパス」平成21年度公開ワークショップ
    • 発表場所
      東京工業大学(東京)
    • 関連する報告書
      2010 研究成果報告書
  • [図書] 特定領域研究「日本語コーパス」平成22年度研究成果報告書『現代日本語書き言葉均衡コーパス』形態論情報規定集 第4版(上・下)2011

    • 著者名/発表者名
      小椋秀樹・小磯花絵・冨士池優美・宮内佐夜香・小西光・原裕
    • 総ページ数
      359
    • 出版者
      国立国語研究所
    • 関連する報告書
      2010 研究成果報告書
  • [図書] 特定領域研究「日本語コーパス」平成 22年度研究成果報告書『現代日本語書き言葉均衡コーパス』形態論情報データベースの設計と実装 改訂版2011

    • 著者名/発表者名
      小木曽智信・中村壮範
    • 総ページ数
      145
    • 出版者
      国立国語研究所
    • 関連する報告書
      2010 研究成果報告書
  • [図書] 『現代日本語書き言葉均衡コーパス』形態論情報規定集第4版(上・下)2011

    • 著者名/発表者名
      小椋秀樹・小磯花絵・冨士池優美・宮内佐夜香・小西光・原裕
    • 総ページ数
      359
    • 出版者
      特定領域研究「日本語コーパス」平成22年度研究成果報告書
    • 関連する報告書
      2010 実績報告書
  • [図書] 『現代日本語書き言葉均衡コーパス』形態論情報データベースの設計と実装改訂版2011

    • 著者名/発表者名
      小木曽智信・中村壮範
    • 総ページ数
      145
    • 出版者
      特定領域研究「日本語コーパス」平成22年度研究成果報告書
    • 関連する報告書
      2010 実績報告書
  • [図書] 『現代日本語書き言葉均衡コーパス』形態論情報規程集(特定領域研究「日本語コーパス」特定領域研究「日本語コーパス」平成21年度研究成果報告書, 第3版)2010

    • 著者名/発表者名
      小椋秀樹・小磯花絵・冨士池優美・宮内佐夜香・原裕
    • 総ページ数
      295
    • 関連する報告書
      2009 実績報告書
  • [図書] 平成20年度研究成果報告書『現代日本語書き言葉均衡コーパス』形態論情報データベースの設計と実装, 特定領域研究「日本語コーパス」特定領域研究「日本語コーパス」2009

    • 著者名/発表者名
      小木曽智信・中村壮範
    • 総ページ数
      141
    • 関連する報告書
      2008 自己評価報告書
  • [図書] 『現代日本語書き言葉均衡コーパス』形態論情報規程集2009

    • 著者名/発表者名
      小椋秀樹・小磯花絵・冨士池優美・原裕
    • 総ページ数
      250
    • 出版者
      特定領域研究「日本語コーパス」平成20年度研究成果報告書
    • 関連する報告書
      2008 実績報告書
  • [図書] 『現代日本語書き言葉均衡コーパス』形態論情報データベースの設計と実装2009

    • 著者名/発表者名
      小木曽智信・中村壮範
    • 総ページ数
      141
    • 出版者
      特定領域研究「日本語コーパス」特定領域研究「日本語コーパス」平成20年度研究成果報告書
    • 関連する報告書
      2008 実績報告書
  • [備考]

    • URL

      http://download.unidic.org/

    • 関連する報告書
      2010 研究成果報告書
  • [備考]

    • URL

      http://download.unidic.org/

    • 関連する報告書
      2010 実績報告書
  • [備考]

    • URL

      http://unidic.download.org/

    • 関連する報告書
      2009 実績報告書
  • [備考] 形態素解析システム用辞書UniDic公開ホームページ

    • URL

      http://unidic.download.org/

    • 関連する報告書
      2008 自己評価報告書
  • [備考] 形態素解析辞書UniDic

    • URL

      http://unidic.download.org/

    • 関連する報告書
      2008 実績報告書

URL: 

公開日: 2006-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi