コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用

基于语料库语言学方法研究狄更斯风格的数据库构建及应用

基本信息

  • 批准号:
    10710229
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1998
  • 资助国家:
    日本
  • 起止时间:
    1998 至 1999
  • 项目状态:
    已结题

项目摘要

本研究計画はDickensの小説全作品を電子コーパス化し、語彙や構文の出現パターンをコンピュータ解析することによって、Dickensの英語を計量的な視点から記述しようという試みである。計画二年目の平成11年度は、前半では、平成10年度に引き続き言語データの電子化法の理論的検討と実験を相補的な形でとりおこなうことによって研究基盤の確立をはかり、後半では、出来上がった電子コーパスを基に文体統計論的分析を行うことでDickensの英語におけるおける語彙の生起パターンと文体変異の相互関係を考察した。研究実績の主な点は次の通り:1.語彙品詞標識マークアップ(組み込み)法の理論的検討および実践。最近のコーパス言語学の成果、とりわけマークアップに関する研究を比較検討し、文体研究に最適化した形でマークアップを応用する方法を研究した。電子テキストを元に、様々なタイプのテキストマークアップの試行とテキスト分析の実験を繰り返し、英語散文のテキスト処理に有用なマークアップ方法の開発を試みた。その結果、品詞標識に関してはPenn-Treebank方式に準じた形式を採用し、自動品詞標識付与プログラム(UNIXサーバ上で稼動)に学習させることで、自動認識率を96%以上にまで高めることが可能になった。本研究計画で作成したコーパスはいずれもPenn-Treebank準拠の品詞標識が埋め込まれている。2.コーパスデータの文体統計学的分析。編纂したコーパスから得られたデータを基に、さまざまな語彙項目や構文間の相互関係、テキスト間の相互関係、そして語彙や構文とテキストとの相互関係を分析した。その結果、Dickensの小説の言語における語彙の出現パターンは、i)経年的に変化しているということ、ii)言語使用域ごとに一貫したパターンが見受けられるということ、iii)作品の冒頭部における変異が最も大きく、作品の巻・章が進行するにつれて、変異が小さくなると言う傾向が見られた。これらのうち最も興味深い現象としてi)の経年変化を挙げることができる。Dickensの文体は前期の作品において典型的に認められるより文語的、形式的、複雑な構造を持ったものから、後期の作品に特徴的な相対的に口語的、並列的、文脈依存な傾向を深めた文体へと移り変わっていることを本研究は明らかにした。
该研究项目是一种尝试从电子化的定量角度来描述狄更斯的英语,并将所有狄更斯的小说以及对词汇和语法的外观模式进行计算机分析。在1999年的第二年,在上半年,我们的目的是通过以互补形式对语言数据进行的理论检查和实验来建立研究基础,然后在上半年,在下半年,我们基于完成的电子语料库进行了风格统计分析,以研究完整的电子语料库,以研究二色氏二色谱之间的互动模式,以构成型模式,以构成的态度构成了出现的态度,并在上半场进行了造型。研究成就的要点如下:1。语音标记(嵌入式)方法的词汇部分的理论检查和实践。我们比较并检查了有关语料库语言学的最新研究,尤其是标记,并研究了以优化形式应用风格研究的标记的研究方法。基于电子文本,我们反复尝试了各种类型的文本标记,并尝试了文本分析,并试图开发一种用于英语散文文本处理的标记方法。结果,根据Penn-Treebank方法采用了语音标志的部分格式,并且通过学习语音标志赠款计划的自动部分(在UNIX服务器上运行),自动识别率可以提高到96%以上。本研究计划中创建的所有语料库都嵌入了符合Penn-Treebank的言论符号。 2。语料库数据的风格统计分析。根据从编译语料库中获得的数据,我们分析了各种词汇和语法,互文关系以及词汇和语法之间的互文关系之间的相互作用。结果,在狄更斯小说的语言中出现词汇的趋势i)随着时间的流逝而改变,ii)每种语言的使用都保持一致的模式,ii ii)工作开始时的突变是最大的,而突变往往会随着工作的数量和章节而下降。其中,最有趣的现象是随着时间的流逝的变化。这项研究表明,狄更斯的风格已经从早期作品中通常看到的文学,形式和复杂的结构转变为与后期作品具有特征的相对口语,平行和上下文相关风格的相对紧密相关。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田畑 智司其他文献

「ズームイン・ズームアウト―デジタルヒューマニティーズとテクストの「読み」―」
《放大与缩小:数字人文与文本的“读”》
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司
  • 通讯作者:
    田畑 智司
知識基盤としてのデジタルライブラリーの将来
数字图书馆作为知识基础设施的未来
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Nakao;K. Honda;A. Notsu;H. Ichihashi;呑海沙織・溝上智恵子;Y.Maeda;田畑 智司;土屋俊
  • 通讯作者:
    土屋俊
修辞項目のアノテーションを活用したテクスト分析
使用修辞项注释进行文本分析
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    斉藤まなぶ;大里絢子;田中勝則;増田貴人,高柳伸哉;安田小響;中村和彦;田畑 智司
  • 通讯作者:
    田畑 智司
Key words and textometry: Are key words really "key" words?
关键词和文本测量:关键词真的是“关键词”吗?
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    呉 沢臣;伊東 栄典;田畑 智司
  • 通讯作者:
    田畑 智司
Too many suspects, too much burstiness: A meta-analysis of key-word-detection statistics for stylometry
嫌疑人太多,突发性太多:文体测量关键词检测统计的元分析
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    呉 沢臣;伊東 栄典;呑海沙織;田畑 智司
  • 通讯作者:
    田畑 智司

田畑 智司的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田畑 智司', 18)}}的其他基金

Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network
语料库文体学的机器学习方法:迈向国际协作网络的创建
  • 批准号:
    18H00675
  • 财政年份:
    2018
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
  • 批准号:
    14710333
  • 财政年份:
    2002
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コンピュータコーパスを用いた18〜19世紀英語散文の文体研究
利用计算机语料库对18-19世纪英语散文进行文体研究
  • 批准号:
    12710254
  • 财政年份:
    2000
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

イギリス児童文学黎明期の女性作家の形容詞と文体:コーパス文体論からのアプローチ
英国儿童文学早期女性作家的形容词和写作风格:语料库文体学的方法
  • 批准号:
    23K00596
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
中世日本語文体の計量的研究
中世纪日本写作风格的定量研究
  • 批准号:
    22KJ2641
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
中世語・近世語におけるコロケーションの文体差および位相差に関する研究
中世纪和近代早期语言搭配的文体差异和相位差异研究
  • 批准号:
    23K00564
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
外国ルーツ高校生の日本語作文の実態調査と日本語教育のための語彙・文法の基礎研究
外籍高中生日语作文调查及日语教育词汇语法基础研究
  • 批准号:
    23K12219
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
A stylistic analysis of 21st-century present-tense fiction
21世纪现在时小说的文体分析
  • 批准号:
    21K00573
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了