2004 Fiscal Year Annual Research Report
英文コーパスを利用した医学関連英語論文作成支援システムの開発
Project/Area Number |
16590430
|
Research Institution | Kyoto Prefectural University of Medicine |
Principal Investigator |
大武 博 京都府立医科大学, 医学研究科, 教授 (20149925)
|
Co-Investigator(Kenkyū-buntansha) |
金子 周司 京都大学, 薬学研究科, 教授 (60177516)
鵜川 義弘 宮城教育大学, 教育学部, 助教授 (20232803)
河本 健 広島大学, 医歯薬学総合研究科, 講師 (50224861)
竹腰 正隆 東海大学, 医学部, 講師 (80221373)
BRIAN Morren 福井県立大学, 学術教養センター, 教授 (20244519)
|
Keywords | 英文コーパス / 共起表現 / 英文用例 / 英文作成支援 / 生命科学 / インターネット |
Research Abstract |
本研究メンバーから成るライフサイエンス辞書プロジェクト(http://1sd-project.jp/)では、PubMedを利用して英文分析用元資料として、生命科学分野の主要学術雑誌に発表された英文抄録を採集し、英文コーパス(LSDコーパス)を作成した。この英文コーパスは、総語数約3000万語、異語数約22万語から構成されている。このコーパスを計量分析した結果、論文抄録の90%は約1万語の範囲内で書かれており、1000語未満の単語が、全体の約70%をカバーしてていることが判明した。本研究プロジェクトでは、任意の語句についての日英対訳、用例、共起を、簡単なインターフェースで瞬時に検索・表示できるシステムを構築し、無償で公開している。平成16年度は、このシステムを利用して、頻度の高い語を中心に、英語ネイティブ著者達の英語の特性を分析し、日本人の書く英語表現との差異を調査研究した。具体例の一つを挙げると、「可能性」という日本語に対応して使われるpossibility, probabilityの用法違いを明らかにした。日本人は「高い可能性」という表現から、high possibilityという用法をかなり高い頻度で利用しているが、LSDコーパスでは、この用法は皆無であった。日本人は、possibilityの直前にhigh, strong, greatなどの形容詞を好んで使い、「可能性」の程度に言及しようとするが、LSDコーパスでは、むしろ「可能性」の質に言及する形容詞(intriguing, interesting, exciting)が好んで使われていることが判明した。LSDコーパスの分析結果から、「高い可能性」を表現する時には、high probabilityという表現が標準であることが判明した。 日本人英語の特性調査研究と平行して、3000万語の抄録の中で、4000回以上出現した動詞・名詞・形容詞および1000回以上出現した副詞を中心に、論文を書くために重要な単語およびその派生語約1000語を選び、それぞれ論文でよく使われる重要連語表現を収集した。
|
Research Products
(2 results)