研究課題/領域番号 |
15H02744
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 筑波大学 |
研究代表者 |
山本 幹雄 筑波大学, システム情報系, 教授 (40210562)
|
研究分担者 |
乾 孝司 筑波大学, システム情報系, 准教授 (60397031)
|
研究協力者 |
乘松 潤矢
谷口 正訓
芳賀 俊平
大隅 賢二
竹中 孝介
石井 瑛彦
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
16,120千円 (直接経費: 12,400千円、間接経費: 3,720千円)
2017年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2016年度: 5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2015年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
|
キーワード | 言語モデル / ダブル配列 / 部分転置ダブル配列 / ランダム配置 / 統計的機械翻訳 / トライ / ngram言語モデル / ngramモデル / シングル配列 |
研究成果の概要 |
ダブル配列言語モデル(Double-Array Language Model: DALM) は、TRIE のコンパクトかつ高速な実装であるダブル配列をベースとし、言語モデルの性質を最大限利用することでバランスのよい実装を実現している。しかし、DALMはモデルパラメータとインデックスを共通の配列に格納しているため、パラメータの量子化による圧縮効果が得られないという問題があった。本研究では、量子化圧縮を可能とするため、確率値を格納した配列を分離した効率的なデータ構造とアルゴリズムを提案した。特に、配列サイズを小さくするために提案した「部分転置ダブル配列」が主要な成果である。
|