• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模なad-hocデータに対する高速処理基盤

研究課題

研究課題/領域番号 16H01715
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
研究分野 ソフトウェア
研究機関東京大学

研究代表者

田浦 健次朗  東京大学, 大学院情報理工学系研究科, 教授 (90282714)

研究期間 (年度) 2016-04-01 – 2021-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
38,870千円 (直接経費: 29,900千円、間接経費: 8,970千円)
2020年度: 9,360千円 (直接経費: 7,200千円、間接経費: 2,160千円)
2019年度: 8,970千円 (直接経費: 6,900千円、間接経費: 2,070千円)
2018年度: 7,020千円 (直接経費: 5,400千円、間接経費: 1,620千円)
2017年度: 7,410千円 (直接経費: 5,700千円、間接経費: 1,710千円)
2016年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
キーワード大規模データ処理 / ad-hocデータ処理 / 字句解析 / 構文解析 / データ抽出 / ad‐hocデータ処理 / 演算子優先度文法 / 構文解析器生成系 / 字句解析器生成系 / ad‐hocデータ / 構文解析器生成器 / 並列構文解析 / スキャナレス構文解析 / LL(*)文法 / 構文解析生成系 / ad-hocデータ / LL(*) / 正規表現 / 高性能計算 / 大規模データ / ストリーム処理 / 解析表現文法 / ニューラル機械翻訳 / 再帰型ニューラルネットワーク / 自然言語処理 / 文字列処理 / SIMD命令
研究成果の概要

並列化, SIMD化を用いた高性能テキスト処理を達成するため, 正規表現または文脈自由文法に対する並列化・ベクトル化された字句解析器・構文解析器を自動生成するアプローチに沿って研究を行った. 字句解析器を用いない(スキャナレス)構文解析に対してSIMD命令を用いて高速化を行うアプローチ, 字句解析器の並列化と, 局所的に構文解析可能な(したがって並列に処理しやすい)文法に対する構文解析器の並列化を行うアプローチを追求した.

研究成果の学術的意義や社会的意義

データ活用はSociety 5.0の要諦である. 多くの利用可能なデータはテキスト形式で保存されている(XML, JSONなど標準的な形式のものもあれば, 決まった形式のないものもある). 文字列に対するデータ処理の一番はじめの段階が字句解析または構文解析と呼ばれる, 一種のパターンマッチング処理である. 本研究はそれらを容易に, かつ高速に処理することを目指したもので, 社会で利用可能なビッグデータの増大に対して有用な貢献を果たしうる研究である.

報告書

(6件)
  • 2021 研究成果報告書 ( PDF )
  • 2020 実績報告書
  • 2019 実績報告書
  • 2018 実績報告書
  • 2017 実績報告書
  • 2016 実績報告書
  • 研究成果

    (19件)

すべて 2022 2021 2019 2018 2017 2016

すべて 雑誌論文 (16件) (うち国際共著 3件、 査読あり 15件、 オープンアクセス 1件、 謝辞記載あり 6件) 学会発表 (3件) (うち国際学会 1件、 招待講演 1件)

  • [雑誌論文] Plex: Scaling Parallel Lexing with Backtrack-Free Prescanning2021

    • 著者名/発表者名
      Le Li, Shigeyuki Sato, Qiheng Liu, Kenjiro Taura
    • 雑誌名

      2021 IEEE International Parallel and Distributed Processing Symposium (IPDPS)

      巻: 会議予稿集のためなし ページ: 693-702

    • DOI

      10.1109/ipdps49936.2021.00079

    • 関連する報告書
      2020 実績報告書
    • 査読あり
  • [雑誌論文] LL(*) 文法に基づくスキャナレス構文解析器の提案2018

    • 著者名/発表者名
      井原 央翔, 佐藤 重幸, 田浦 健次朗
    • 雑誌名

      Cross-disciplinary workshop on computing Systems, Infrastructures, and programming (xSIG) 2018

      巻: -

    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [雑誌論文] OPG を利用したアドホックな並列データ処理系2018

    • 著者名/発表者名
      リュウ ケイコウ, 井原 央翔, 田浦 健次朗
    • 雑誌名

      情報処理学会論文誌プログラミング(PRO)

      巻: 12 ページ: 1-8

    • NAID

      170000150059

    • 関連する報告書
      2018 実績報告書
  • [雑誌論文] LL(*) 文法に基づくスキャナレス構文解析器の提案2018

    • 著者名/発表者名
      井原 央翔, 佐藤 重幸, 田浦 健次朗
    • 雑誌名

      xSIG 2018 workshop

      巻: -

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] Parallelized software offloading of low-level communication with user-level threads2018

    • 著者名/発表者名
      Wataru Endo and Kenjiro Taura
    • 雑誌名

      Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region

      巻: - ページ: 289-298

    • DOI

      10.1145/3149457.3149475

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] 低レイテンシ SSD をメモリ拡張として利用したときの性能評価2018

    • 著者名/発表者名
      中澤 弘樹, 田浦 健次朗
    • 雑誌名

      xSIG 2018 workshop

      巻: -

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] Cache friendly parallelization of neural encoder-decoder models without padding on multi-core architecture.2017

    • 著者名/発表者名
      Yuchen Qiao, Kazuma Hashimoto, Akiko Eriguchi, Haixia Wang, Dongsheng Wang, Yoshimasa Tsuruoka, and Kenjiro Taura.
    • 雑誌名

      The 6th International Workshop on Parallel and Distributed Computing for Large Scale Machine Learning and Big Data Analytics

      巻: - ページ: 437-440

    • DOI

      10.1109/ipdpsw.2017.165

    • 関連する報告書
      2017 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Neural Machine Translation with Source-Side Latent Graph Parsing2017

    • 著者名/発表者名
      Kazuma Hashimoto and Yoshimasa Tsuruoka
    • 雑誌名

      Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing (EMNLP 2017)

      巻: - ページ: 125-135

    • DOI

      10.18653/v1/d17-1012

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] Learning to Parse and Translate Improves Neural Machine Translation2017

    • 著者名/発表者名
      Akiko Eriguchi, Yoshimasa Tsuruoka, and Kyunghyun Cho
    • 雑誌名

      Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (ACL2017)

      巻: - ページ: 72-78

    • DOI

      10.18653/v1/p17-2012

    • 関連する報告書
      2017 実績報告書
    • 査読あり / 国際共著
  • [雑誌論文] Cache Friendly Parallel Encoder-Decoder Model without Padding on Mulit-core Architecture2017

    • 著者名/発表者名
      Yuchen Qiao, Kenjiro Taura, Kazuma Hashimoto, Yoshimasa Tsuruoka and Akkiko Eriguchi
    • 雑誌名

      Proceedings of The 6th International Workshop on Parallel and Distributed Computing for Large Scale Machine Learning and Big Data Analytics

      巻: -

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 国際共著 / 謝辞記載あり
  • [雑誌論文] Low latency and resource-aware program composition for large-scale data analysis2016

    • 著者名/発表者名
      Masahiro Tanaka, Kenjiro Taura, and Kentaro Torisawa
    • 雑誌名

      16th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid)

      巻: - ページ: 325-330

    • DOI

      10.1109/ccgrid.2016.88

    • 関連する報告書
      2016 実績報告書
    • 査読あり
  • [雑誌論文] A static cut-off for task parallel programs2016

    • 著者名/発表者名
      Shintaro Iwasaki, Kenjiro Taura
    • 雑誌名

      Proceedings of the 2016 International Conference on Parallel Architectures and Compilation

      巻: - ページ: 139-150

    • DOI

      10.1145/2967938.2967968

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Fragmented BWT: An Extended BWT for Full-Text Indexing2016

    • 著者名/発表者名
      Masaru Ito, Hiroshi Inoue, and Kenjiro Taura
    • 雑誌名

      International Symposium on String Processing and Information Retrieval

      巻: - ページ: 97-109

    • DOI

      10.1007/978-3-319-46049-9_10

    • ISBN
      9783319460482, 9783319460499
    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Autotuning of a Cut-Off for Task Parallel Programs2016

    • 著者名/発表者名
      Shintaro Iwasaki, Kenjiro Taura
    • 雑誌名

      IEEE 10th International Symposium on Embedded Multicore/Many-core Systems-on-Chip (MCSoC)

      巻: - ページ: 353-360

    • DOI

      10.1109/mcsoc.2016.51

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Domain Adaptation and Attention-Based Unknown Word Replacement in Chinese-to-Japanese Neural Machine Translation2016

    • 著者名/発表者名
      Kazuma Hashimoto, Akiko Eriguchi, and Yoshimasa Tsuruoka
    • 雑誌名

      the 3rd Workshop on Asian Translation (WAT2016)

      巻: - ページ: 75-83

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Character-based Decoding in Tree-to-Sequence Attention-based Neural Machine Translation2016

    • 著者名/発表者名
      Akiko Eriguchi, Kazuma Hashimoto, and Yoshimasa Tsuruoka
    • 雑誌名

      the 3rd Workshop on Asian Translation (WAT2016)

      巻: - ページ: 175-183

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [学会発表] Simultaneous Finite Automaton の部分構成による並列正規表現マッチ2022

    • 著者名/発表者名
      高品 剛大, 佐藤 重幸, 田浦 健次朗
    • 学会等名
      第24回プログラミングおよびプログラミング言語ワークショップ(PPL 2022)
    • 関連する報告書
      2020 実績報告書
  • [学会発表] OPGを使ったアドホックな大規模な文字列データ解析のための並列処理系2019

    • 著者名/発表者名
      リュウ ケイコウ
    • 学会等名
      情報処理学会論文誌プログラミング(PRO)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] A Quest for Unified, Global View Parallel Programming Models for Our Future2016

    • 著者名/発表者名
      Kenjiro Taura
    • 学会等名
      A Quest for Unified, Global View Parallel Programming Models for Our Future
    • 発表場所
      Kyoto
    • 関連する報告書
      2016 実績報告書
    • 国際学会 / 招待講演

URL: 

公開日: 2016-04-21   更新日: 2023-03-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi