• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Building a Native/Non溶ative EngIish Language Technical Paper Corpus from Web and its Release and Application

Research Project

Project/Area Number 20320082
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Research Field Foreign language education
Research InstitutionKyushu University

Principal Investigator

TOMIURA Yoich1 (TOMIURA Yoichi)  九州大学, システム情報科学研究院, 教授 (10217523)

Co-Investigator(Kenkyū-buntansha) TANAKA Shosaku  立命館大学, 文学部, 准教授 (00325549)
GOTO Kazuaki  摂南大学, 外国語学部, 講師 (90397662)
HAYAMA Megumi  濁協大学, 外国語学部, 准教授 (60409555)
ANDO Nahoko  九州大学, 大学院・法学研究院, 専門研究員 (50380655)
SHIBATA Msahiro  九州大学, 情報基盤研究開発センター, 学術研究員 (00452813)
Project Period (FY) 2008 – 2011
Project Status Completed (Fiscal Year 2011)
Budget Amount *help
¥12,350,000 (Direct Cost: ¥9,500,000、Indirect Cost: ¥2,850,000)
Fiscal Year 2011: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
Fiscal Year 2010: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2009: ¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2008: ¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Keywordsコーパス / Web / 英文の質判定 / 仮説検定 / 英作文支援 / 英語教育 / 著作権 / Web文書 / 英文の質判別 / 不自然な表現 / 作文支援 / 著作権法 / 著作憲法 / 教育工学 / 母語話者性判別 / 日本人固有の不自然な表現
Research Abstract

We developed a method for collecting English language technical papers on the private web pages using web search engine and a statistical method for estimating the English quality of a document based on the characteristics about the sequences of part of speeches in the document. Furthermore, using these methods, we developed a system to build a large-scale English language technical paper corpus from Web, which includes the information about English quality for each paper. We also investigated copyright problems and what we should consider on building a corpus form Web and releasing it.

Report

(6 results)
  • 2011 Annual Research Report   Final Research Report ( PDF )
  • 2010 Annual Research Report   Self-evaluation Report ( PDF )
  • 2009 Annual Research Report
  • 2008 Annual Research Report
  • Research Products

    (38 results)

All 2012 2011 2010 2009 2008 Other

All Journal Article (19 results) (of which Peer Reviewed: 15 results) Presentation (18 results) Remarks (1 results)

  • [Journal Article] コーパス構築と著作権:Webを源とした質情報付き英語科学論文コーパス2012

    • Author(s)
      田中省作, 安東奈穂子, 冨浦洋一
    • Journal Title

      英語コーパス研究

      Volume: 19 Pages: 31-41

    • NAID

      40019352357

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 英語科学論文コーパスにおけるNS/NNSの名詞用法の差異2012

    • Author(s)
      後藤一章
    • Journal Title

      Setsunan Journal of English Education

      Volume: 6 Pages: 57-64

    • NAID

      40019239100

    • Related Report
      2011 Annual Research Report
  • [Journal Article] 日本人英語学習者の語彙サイズとコロケーション性判断の関係2012

    • Author(s)
      羽山恵
    • Journal Title

      英語研究(獨協大学)

      Volume: 70 Pages: 73-80

    • Related Report
      2011 Annual Research Report
  • [Journal Article] Tomiura, Extraction of Alternative Candidates for Unnatural Adjective-Noun Co-occurrence Construction of English2011

    • Author(s)
      M. Shibata, T. Funatsu, Y. Tomiura
    • Journal Title

      Procedia Social and Behavioral Science

      Volume: Vol.27 Pages: 32-41

    • Related Report
      2011 Final Research Report
    • Peer Reviewed
  • [Journal Article] Webを源とした質情報付き英語科学論文コーパスの構築法2011

    • Author(s)
      田中省作, 柴田雅博, 冨浦洋一
    • Journal Title

      英語コーパス研究

      Volume: 第18巻 Pages: 61-71

    • NAID

      40018843141

    • Related Report
      2011 Final Research Report 2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Extraction of Alternative Candidates for Unnatural Adjective-Noun Co-occurrence Construction of English2011

    • Author(s)
      Masahiro Shibata, Toshiaki Funatsu, Yoichi Tomiura
    • Journal Title

      Procedia-Social and Behavioral Sciences

      Volume: 27 Pages: 32-41

    • DOI

      10.1016/j.sbspro.2011.10.580

    • Related Report
      2011 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Webコーパスの言語情報処理基盤2011

    • Author(s)
      田中省作
    • Journal Title

      英語コーパス研究 第18巻(印刷中)

    • Related Report
      2010 Self-evaluation Report
    • Peer Reviewed
  • [Journal Article] Webを源とした質情報付き英語科学論文コーパスの構築法2011

    • Author(s)
      田中省作, 柴田雅博, 冨浦洋一
    • Journal Title

      英語コーパス研究 第18巻(印刷中)

    • NAID

      40018843141

    • Related Report
      2010 Self-evaluation Report
    • Peer Reviewed
  • [Journal Article] Webコーパスの言語情報処理基盤2011

    • Author(s)
      田中省作
    • Journal Title

      英語コーパス研究

      Volume: 18(印刷中)

    • Related Report
      2010 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Webコーパスの言語情報処理基盤2010

    • Author(s)
      田中省作
    • Journal Title

      英語コーパス研究

      Volume: 第18巻 Pages: 97-111

    • Related Report
      2011 Final Research Report
    • Peer Reviewed
  • [Journal Article] 著作権法のもとでの情報解析2010

    • Author(s)
      安東奈穂子
    • Journal Title

      人工知能学会誌

      Volume: 第25巻 Pages: 634-652

    • Related Report
      2011 Final Research Report 2010 Annual Research Report
  • [Journal Article] 著作権法のもとでの情報解析2010

    • Author(s)
      安東奈穂子
    • Journal Title

      人工知能学会誌 第25巻

      Pages: 634-652

    • Related Report
      2010 Self-evaluation Report
  • [Journal Article] dentification among Similar Languages Using Statistical Hypothesis Testing2009

    • Author(s)
      M. Shibata, Y. Tomiura, T. Mizuta
    • Journal Title

      Proc. of Pacific Association for Computational Linguistics

      Pages: 47-52

    • Related Report
      2011 Final Research Report
    • Peer Reviewed
  • [Journal Article] 仮説検定に基づく英文書の母語話者性の判別2009

    • Author(s)
      冨浦洋一, 青木さやか, 柴田雅博, 行野顕正
    • Journal Title

      自然言語処理

      Volume: Vol.16 Pages: 23-46

    • NAID

      10024758540

    • Related Report
      2011 Final Research Report
    • Peer Reviewed
  • [Journal Article] Identification among Similar Languages Using Statistical Hypothesis Testing2009

    • Author(s)
      M.Shibata, Y.Tomiura, T.Mizuta
    • Journal Title

      Proc. of Pacific Association for Computational Linguistics

      Pages: 47-52

    • Related Report
      2010 Self-evaluation Report
    • Peer Reviewed
  • [Journal Article] 仮説検定に基づく英文書の母語話者性の判別2009

    • Author(s)
      冨浦洋一, 青木さやか, 柴田雅博, 行野顕正
    • Journal Title

      自然言語処理 Vol.16

      Pages: 23-46

    • NAID

      10024758540

    • Related Report
      2010 Self-evaluation Report
    • Peer Reviewed
  • [Journal Article] Identification among Similar Languages Using Statistical Hypothesis Testing2009

    • Author(s)
      M.Shibata, Y.Tomiura, T.Mizuta
    • Journal Title

      Proc.of Pacific Association for Computational Linguistics

      Pages: 47-52

    • Related Report
      2009 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 仮説検定に基づく英文書の母語話者性の判別2009

    • Author(s)
      冨浦 洋一
    • Journal Title

      自然言語処理 16

      Pages: 25-46

    • NAID

      10024758540

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Webを源とした質情報付き英語科学論文コーパス

    • Author(s)
      田中省作, 安東奈穂子, 冨浦洋一, コーパス構築と著作権
    • Journal Title

      英語コーパス研究

      Volume: 第19巻(印刷中) Pages: 31-41

    • Related Report
      2011 Final Research Report
    • Peer Reviewed
  • [Presentation] 学校英文法の学参例文データベースとその応用2012

    • Author(s)
      田中省作, 小林雄一郎, 徳見道夫, 後藤一章, 冨浦洋一, 柴田雅博
    • Organizer
      情報処理学会人文科学とコンピュータ研究会第93回研究発表会
    • Place of Presentation
      奄美市立奄美博物館
    • Year and Date
      2012-02-27
    • Related Report
      2011 Annual Research Report
  • [Presentation] N-gramを素性とするパタン認識を用いた英語科学論文の質判定2012

    • Author(s)
      小林雄一郎, 田中省作, 冨浦洋一
    • Organizer
      情報処理学会自然言語処理研究会第205回研究発表会
    • Place of Presentation
      福岡大学
    • Year and Date
      2012-01-21
    • Related Report
      2011 Annual Research Report
  • [Presentation] メタ談話標識を素性とするパターン認識を用いた英語科学論文の質判定2011

    • Author(s)
      小林雄一郎, 田中省作, 冨浦洋一
    • Organizer
      情報処理学会人文科学とコンピュータ研究会シンポジウム「じんもんこん2011」
    • Place of Presentation
      龍谷大学
    • Year and Date
      2011-12-10
    • Related Report
      2011 Annual Research Report
  • [Presentation] 学校文法に基づいた英文解析による言語データの頻度分析2011

    • Author(s)
      田中省作, 冨浦洋一, 徳見道夫
    • Organizer
      英語コーパス学会第37回大会
    • Place of Presentation
      京都外国語大学
    • Year and Date
      2011-10-01
    • Related Report
      2011 Annual Research Report
  • [Presentation] Extraction of Alternative Candidates for Unnatural Adjective-Noun Co-occurrence Construction of English2011

    • Author(s)
      M. Shibata, T. Funatsu, Y. Tomiura
    • Organizer
      Pacific Association for Computational Linguistics(PACLING' 11)
    • Place of Presentation
      Malaysia
    • Year and Date
      2011-07-19
    • Related Report
      2011 Final Research Report
  • [Presentation] Extraction of Alternative Candidates for Unnatural Adjective-Noun Co-occurrence Construction of English2011

    • Author(s)
      Masahiro Shibata, Toshiaki Funatsu, Yoichi Tomiura
    • Organizer
      PACLING2011
    • Place of Presentation
      the International Islamic University Malaysia, Kuala Lumpur, Malaysia
    • Year and Date
      2011-07-19
    • Related Report
      2011 Annual Research Report
  • [Presentation] 冨浦洋一,ランダムフォレストを用いた英語科学論文の分類と評価2011

    • Author(s)
      小林雄一郎,田中省作,冨浦洋一
    • Organizer
      情報処理学会人文科学とコンピュータ研究会第90回研究発表会
    • Place of Presentation
      同志社大学
    • Year and Date
      2011-05-21
    • Related Report
      2011 Final Research Report
  • [Presentation] ランダムフォレストを用いた英語科学論文の分類と評価2011

    • Author(s)
      小林雄一郎, 田中省作, 冨浦洋一
    • Organizer
      情報処理学会人文科学とコンピュータ研究会第90回研究発表会
    • Place of Presentation
      同志社大学
    • Year and Date
      2011-05-21
    • Related Report
      2011 Annual Research Report
  • [Presentation] Webコーパスの言語情報処理基盤2010

    • Author(s)
      田中省作
    • Organizer
      英語コーパス学会第35回大会シンポジウム
    • Place of Presentation
      兵庫県立大学(兵庫県)
    • Year and Date
      2010-04-24
    • Related Report
      2011 Final Research Report 2010 Annual Research Report 2010 Self-evaluation Report
  • [Presentation] Webを源とした英語科学論文コーパスの構築一技術的方法論と法的観点からの検討一2009

    • Author(s)
      田中省作
    • Organizer
      英語コーパス学会第34回大会
    • Place of Presentation
      青山学院大学(東京都)
    • Year and Date
      2009-10-03
    • Related Report
      2011 Final Research Report
  • [Presentation] Webを源とした英語科学論文コーパスの構築-技術的方法論と法的観点からの検討-2009

    • Author(s)
      田中省作
    • Organizer
      英語コーパス学会第34回大会
    • Place of Presentation
      青山学院大学(東京都)
    • Year and Date
      2009-10-03
    • Related Report
      2010 Self-evaluation Report 2009 Annual Research Report
  • [Presentation] 母語話者/非母語話者コーパスを用いた不自然な英語表現の抽出2009

    • Author(s)
      水田貴章
    • Organizer
      電気関係学会九州支部連合大会(第62回)
    • Place of Presentation
      九州工業大学(福岡県)
    • Year and Date
      2009-09-28
    • Related Report
      2010 Self-evaluation Report 2009 Annual Research Report
  • [Presentation] dentification among Similar Languages Using Statistical Hypothesis Testing2009

    • Author(s)
      M. Shibata, Y. Tomiura, T. Mizuta
    • Organizer
      Pacific Association for Computational Linguistics(PACLING' 09)
    • Place of Presentation
      Hokkaido University
    • Year and Date
      2009-09-01
    • Related Report
      2011 Final Research Report
  • [Presentation] 文分類モデルに基づいた多様なレベルのESP特徴表現の抽出2009

    • Author(s)
      田中 省作
    • Organizer
      言語研究と統計2009
    • Place of Presentation
      統計数理研究所(東京都)
    • Year and Date
      2009-03-15
    • Related Report
      2008 Annual Research Report
  • [Presentation] 仮説検定に基づいた言語識別2008

    • Author(s)
      水田貴章
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      九州大学(福岡県)
    • Year and Date
      2008-11-27
    • Related Report
      2010 Self-evaluation Report
  • [Presentation] 仮説検定に基づいた言語識別2008

    • Author(s)
      水田 貴章
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      九州大学(福岡市)
    • Year and Date
      2008-11-27
    • Related Report
      2008 Annual Research Report
  • [Presentation] 言語処理を活用した英語教育事情〜できそうなこと, できそうにないこと2008

    • Author(s)
      田中 省作
    • Organizer
      LEIS月例英語教育公開講座
    • Place of Presentation
      立命館大学(京都市)
    • Year and Date
      2008-09-20
    • Related Report
      2008 Annual Research Report
  • [Presentation] 学校英文法コーパス構築の試み2008

    • Author(s)
      田中 省作
    • Organizer
      人工知能学会全国大会
    • Place of Presentation
      ときわ市民ホール(旭川市)
    • Year and Date
      2008-06-12
    • Related Report
      2008 Annual Research Report
  • [Remarks]

    • URL

      http://nlp.inf,kyushu-u.ac,jp

    • Related Report
      2011 Final Research Report

URL: 

Published: 2008-04-01   Modified: 2017-10-13  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi