コンピュータコーパスを用いた18〜19世紀英語散文の文体研究

利用计算机语料库对18-19世纪英语散文进行文体研究

基本信息

  • 批准号:
    12710254
  • 负责人:
  • 金额:
    $ 1.47万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2001
  • 项目状态:
    已结题

项目摘要

本研究は18〜19世紀の英語散文大規模コーパスを構築し,いわゆる「散文の世紀」と呼ばれる時代からvictoria時代にかけての英語散文の文体的特徴を通時的視座および共時的視座の両面から記述しようという試みである。計二年目の平成13年度は,前半では,平成12年度に引き続き言語データの電子化法の理論的検討と実験を相補的な形でとりおこなうことによって研究基盤の確立をはかり,後半では,出来上がった電子コーパスの統計学的解析を通して,英語散文文体における口語化の傾向や言語使用域における文体変異の相を分析した。研究成果の主な点は次の通りである:1.語彙品詞標識マークアップ(組み込み)法の理論的検討および実践。最近のコーパス言語学の成果,とりわけマークアップに関する研究を比較検討し,文体研究に最適化した形でマークアップを応用する方法を研究した。電子テキストを元に,様々なタイプのテキストマークアップの試行とテキスト分析の実験を繰り返し,英語散文のテキスト処理に有用なマークアップ方法の開発を試みた。その結果,品詞標識に関してはPenn-Treebank方式に準じた形式を採用し,自動品詞標識付与プログラム(UNIXサーバ上で稼働)に学習させることで,自動認識率を96%以上にまで高めることが可能になった。本研究計画で作成したコーパスはいずれもPenn-Treebank準拠の品詞標識が埋め込まれている。なお,この成果の一部については,研究代表者が編集した論文集『電子化言語資料分析の方法論』(大阪大学言語文化部・大阪大学大学院言語文化研究科発行)所収の「英語文体論研究のための言語処理技術-Corpus Processing for Stylistic Analysis of Texts」に発表した。2.コーパスデータの文体統計学的分析。編纂したコーパスから得られたデータを基に,さまざまな語彙項目や構文間の相互関係,テキスト間の相互関係,そして語彙や構文とテキストとの相互関係を分析し,Dickensの散文を軸にその前後の時代,すなわち,18世紀および19世紀後半の散文との文体比較を行った。その結果、18〜19世紀の英語散文における言語特徴の出現パターンは,経年的に変化しているということ,特に,19世紀初頭の散文において典型的に認められるより文語的,形式的,複雑な構造を持ったものから,19世紀後半の散文に特徴的な相対的に口語的,並列的,文脈依存な傾向を深めた文体へと移り変わっていることを本研究は明らかにした。なお、この成果の一部はオランダ・Rodopi社より本年3月発刊のEnglish Corpus Linguistics in Japanの第16章1nvestigating Stylistic Variation in Dickens through Correspondence Analysis of Word-Class Distribution,および渡辺秀樹(編)『英語文体論の方法と射程』(大阪大学言語文化部・大阪大学大学院言語文化研究科発行)の第4章「コーパス言語学の文体論:Corpus-Based Stylistics-MF/MD法による文体比較」にて発表した。
这项研究的目的是从18世纪和19世纪构建大规模的英语散文,并从道主和同步的角度描述了英语散文的风格特征,从称为“散文的世纪”到维多利亚时代。在2001年总数的第二年,在上半年,我们通过在上半年进行了互补的语言数据数字化方法来建立研究基础,然后在上半年,在下半年,我们分析了英国散文风格风格的插话趋势,并通过语言分析进行了兴趣分析。研究结果的要点如下:1。语音标记(嵌入式)方法的词汇部分的理论检查和实践。比较了语料库语言学的最新结果,尤其是标记的结果,并以优化形式进行风格研究的标记方法进行了比较。基于电子文本,我们重复了各种类型的文本标记试验和文本分析实验,并试图开发一种用于英语散文文本处理的有用标记方法。结果,通过使用符合Penn-Treebank方法的格式,并通过训练自动词性词性标记程序(在UNIX服务器上操作),可以通过使用符合Penn-Treebank方法的格式来提高自动识别率。本研究计划中创建的所有语料库都嵌入了符合Penn-Treebank的言论符号。其中一些结果发表在“用于文本的造型师分析”中,这是由主要研究者编写的论文集合,“电子语言材料分析的方法”(大阪大学语言与文化系和大阪大学语言与文化学院出版)。 2。语料库数据的风格统计分析。根据从编译语料库中获得的数据,我们分析了各种词汇和语法,互文关系以及词汇和语法和文本之间的互文关系之间的相互作用,并将19世纪和19世纪后期的散文与诗句进行了比较,基于狄更斯的诗意。结果,这项研究表明,随着时间的流逝,英语散文中语言特征的外观随着时间的流逝而发生了变化,尤其是那些在19世纪初具有更深层散文的文学,正式和复杂结构的人,散发出更深层,相对较深的,平行和背景的倾向,而在19世纪末,散文的趋势具有更深的倾向。其中一些结果在第16章,第1章中介绍了通过对文字级分布的对应分析进行调查,并在今年3月发表,在第4章中发表,“语料库语言学故事理论:使用基于语料库的造型师MF/MD的样式比较,使用基于本文的造型型”,日本语言语言中的英语语言学“在本年度上发表的英语语言学”。基于语料库的设计师MF/MD方法“英语文体学理论的方法和范围”(大阪大学编辑,大阪大学语言与文化研究生院)。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tomoji Tabata(共著): "English Corpus Linguistics in Japan"Editions Rodopi. 340 (2002)
Tomoji Tabata(合著者):《日本英语语料库语言学》Editions Rodopi 340 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
田畑 智司: "第4章コーパス言語学の文体論:Corpus-Based Stylistics-MF/MD法による文体比較-"渡辺秀樹(編)英語文体論の方法と射程(大阪大学言語文化部・大阪大学大学院言語文化研究科発行). 75-89 (2002)
Satoshi Tabata:“第 4 章语料库语言学的文体学:使用基于语料库的文体学-MF/MD 方法的文体学比较” Hideki Watanabe(编辑)英语文体学的方法和范围(大阪大学语言文化学院研究生院)大阪大学)语言文化研究生院出版)75-89(2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
田畑 智司(編): 電子化言語資料分析の方法論(大阪大学言語文化部・大阪大学大学院言語文化研究科発行). 40 (2002)
Satoshi Tabata(编辑):分析数字化语言材料的方法(大阪大学语言文化学院/大阪大学语言文化研究生院出版)40(2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
田畑 智司: "英語文体論研究のための言語処理技術-Corpus Processing for Stylistic Analysis of Texts"田畑 智司(編)電子化言語資料分析の方法論(大阪大学言語文化部・大阪大学大学院言語文化研究科発行). 25-39 (2002)
Satoshi Tabata:《文本文体分析的语言处理技术》Satoshi Tabata(主编)《数字化语言材料分析方法》(大阪大学语言文化学院/大阪大学语言文化研究生院出版)25-39。 (2002)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田畑 智司其他文献

「ズームイン・ズームアウト―デジタルヒューマニティーズとテクストの「読み」―」
《放大与缩小:数字人文与文本的“读”》
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司
  • 通讯作者:
    田畑 智司
Death and Life in Chaucer's The Book of the Duchess : With Special Reference to "herte"
乔叟《公爵夫人之书》中的死与生:特别提到“herte”
Tracing Thematic Transition in Dickens’s Literature and Journalism
追踪狄更斯文学与新闻学的主题转变
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nagasaki;Kiyonori;田畑 智司;Saoko Funada;Tomoji Tabata;Tomoji Tabata
  • 通讯作者:
    Tomoji Tabata
Key words and textometry: Are key words really "key" words?
关键词和文本测量:关键词真的是“关键词”吗?
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    呉 沢臣;伊東 栄典;田畑 智司
  • 通讯作者:
    田畑 智司
知識基盤としてのデジタルライブラリーの将来
数字图书馆作为知识基础设施的未来
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Nakao;K. Honda;A. Notsu;H. Ichihashi;呑海沙織・溝上智恵子;Y.Maeda;田畑 智司;土屋俊
  • 通讯作者:
    土屋俊

田畑 智司的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田畑 智司', 18)}}的其他基金

Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network
语料库文体学的机器学习方法:迈向国际协作网络的创建
  • 批准号:
    18H00675
  • 财政年份:
    2018
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
  • 批准号:
    14710333
  • 财政年份:
    2002
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用
基于语料库语言学方法研究狄更斯风格的数据库构建及应用
  • 批准号:
    10710229
  • 财政年份:
    1998
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似国自然基金

城市群文体公共设施资源配置优化研究
  • 批准号:
    71874120
  • 批准年份:
    2018
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目

相似海外基金

わが国における文化芸術統計の体系化-理論的枠組みの構築と体系的統計データ集の作成-
日本文化艺术统计的系统化 - 建立理论框架并创建系统的统计数据收集 -
  • 批准号:
    23K01339
  • 财政年份:
    2023
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Emergence and Expansion of "Readable Body" in the Modern World: A Historical Approach to the Origin of Biometrics
现代世界“可读身体”的出现和扩展:生物识别技术起源的历史途径
  • 批准号:
    20H01332
  • 财政年份:
    2020
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Identification of genetic polymorphisms that are risk factors for neutropenia in TPF therapy
TPF 治疗中中性粒细胞减少症危险因素遗传多态性的鉴定
  • 批准号:
    19K18761
  • 财政年份:
    2019
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
東北北部の縄文時代人口の推計および人口変動と祭祀や墓制の変化との関連性分析
东北北部绳文时代人口的推算及人口变化与仪式、坟墓制度变迁的关系分析
  • 批准号:
    19K01118
  • 财政年份:
    2019
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of experiments designed for Project-based Learning (PBL) by means of Science Origami
通过 Science Origami 开发基于项目的学习 (PBL) 的实验
  • 批准号:
    17K01039
  • 财政年份:
    2017
  • 资助金额:
    $ 1.47万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了