コーパス言語学的手法に基づくディケンズの文体研究のためのデータベース構築と応用

基于语料库语言学方法研究狄更斯风格的数据库构建及应用

基本信息

  • 批准号:
    10710229
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1998
  • 资助国家:
    日本
  • 起止时间:
    1998 至 1999
  • 项目状态:
    已结题

项目摘要

本研究計画はDickensの小説全作品を電子コーパス化し、語彙や構文の出現パターンをコンピュータ解析することによって、Dickensの英語を計量的な視点から記述しようという試みである。計画二年目の平成11年度は、前半では、平成10年度に引き続き言語データの電子化法の理論的検討と実験を相補的な形でとりおこなうことによって研究基盤の確立をはかり、後半では、出来上がった電子コーパスを基に文体統計論的分析を行うことでDickensの英語におけるおける語彙の生起パターンと文体変異の相互関係を考察した。研究実績の主な点は次の通り:1.語彙品詞標識マークアップ(組み込み)法の理論的検討および実践。最近のコーパス言語学の成果、とりわけマークアップに関する研究を比較検討し、文体研究に最適化した形でマークアップを応用する方法を研究した。電子テキストを元に、様々なタイプのテキストマークアップの試行とテキスト分析の実験を繰り返し、英語散文のテキスト処理に有用なマークアップ方法の開発を試みた。その結果、品詞標識に関してはPenn-Treebank方式に準じた形式を採用し、自動品詞標識付与プログラム(UNIXサーバ上で稼動)に学習させることで、自動認識率を96%以上にまで高めることが可能になった。本研究計画で作成したコーパスはいずれもPenn-Treebank準拠の品詞標識が埋め込まれている。2.コーパスデータの文体統計学的分析。編纂したコーパスから得られたデータを基に、さまざまな語彙項目や構文間の相互関係、テキスト間の相互関係、そして語彙や構文とテキストとの相互関係を分析した。その結果、Dickensの小説の言語における語彙の出現パターンは、i)経年的に変化しているということ、ii)言語使用域ごとに一貫したパターンが見受けられるということ、iii)作品の冒頭部における変異が最も大きく、作品の巻・章が進行するにつれて、変異が小さくなると言う傾向が見られた。これらのうち最も興味深い現象としてi)の経年変化を挙げることができる。Dickensの文体は前期の作品において典型的に認められるより文語的、形式的、複雑な構造を持ったものから、後期の作品に特徴的な相対的に口語的、並列的、文脈依存な傾向を深めた文体へと移り変わっていることを本研究は明らかにした。
该研究计划试图通过将所有狄更斯的小说转换为电子唱片并分析词汇和语法的外观模式来描述狄更斯英语。在计划的第二年,在1999年上半年,在上半年,对语言数据的语言数据的理论研究是理论研究和实验,并以互补形式进行,下半年,下半年,下半年,在下半年。通过基于完成的电子外套进行样式统计分析,我们考虑了基于词汇的偏振模式与狄更斯的样式突变之间的相互作用。研究成就的要点是:1。词汇标签标记标记(Incorporated)定律的理论检查和实践。他已经比较并研究了Copass语言学(尤其是标记)的最新结果的研究,并研究了如何将优化的标记应用于样式研究的方法。基于电子文本,我们重复了各种类型的文本标记试验和文本 - 分析实验,并试图开发有用的标记方法 - 用于英语散文的文本处理。结果,语音标志采用了等效于Penn-Treebank方法的格式,并且通过通过具有自动精制口头标记的程序学习,可以将自动识别率提高到96%或更高(操作Unix服务器)。本研究计划中创建的所有库型都嵌入了佩恩 - 特里班克的铅笔。 2。CAPUS数据的统计分析。根据从编译的Capus获得的数据,我们分析了各种词汇项目,在语法之间进行交互,与文本相互作用,并与词汇和文本进行交互。结果,狄更斯小说中词汇的外观模式随着时间的流逝而变化,在III的开始时,在每个语言使用区域中都发现了一致的模式。工作和章节进展,突变变小。其中最有趣的现象是i的衰老。狄更斯的风格具有更为文学,正式和复杂的结构,通常在以前的工作中被认可,并且相对俗语,平行和环境依赖性趋势是第二学期的特征。一种加深的风格。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

田畑 智司其他文献

「ズームイン・ズームアウト―デジタルヒューマニティーズとテクストの「読み」―」
《放大与缩小:数字人文与文本的“读”》
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田畑 智司;Tomoji Tabata;田畑 智司;田畑 智司;Tomoji Tabata;Tomoji Tabata;Tomoji Tabata;田畑 智司
  • 通讯作者:
    田畑 智司
知識基盤としてのデジタルライブラリーの将来
数字图书馆作为知识基础设施的未来
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Nakao;K. Honda;A. Notsu;H. Ichihashi;呑海沙織・溝上智恵子;Y.Maeda;田畑 智司;土屋俊
  • 通讯作者:
    土屋俊
修辞項目のアノテーションを活用したテクスト分析
使用修辞项注释进行文本分析
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    斉藤まなぶ;大里絢子;田中勝則;増田貴人,高柳伸哉;安田小響;中村和彦;田畑 智司
  • 通讯作者:
    田畑 智司
Key words and textometry: Are key words really "key" words?
关键词和文本测量:关键词真的是“关键词”吗?
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    呉 沢臣;伊東 栄典;田畑 智司
  • 通讯作者:
    田畑 智司
Too many suspects, too much burstiness: A meta-analysis of key-word-detection statistics for stylometry
嫌疑人太多,突发性太多:文体测量关键词检测统计的元分析
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    呉 沢臣;伊東 栄典;呑海沙織;田畑 智司
  • 通讯作者:
    田畑 智司

田畑 智司的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('田畑 智司', 18)}}的其他基金

Machine-learning Approaches to Corpus Stylistics: Towards the Creation of International Collaborative Network
语料库文体学的机器学习方法:迈向国际协作网络的创建
  • 批准号:
    18H00675
  • 财政年份:
    2018
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
コーパスに基づく近代英語散文の通史的文体研究
基于语料库的现代英语散文的历史文体研究
  • 批准号:
    14710333
  • 财政年份:
    2002
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コンピュータコーパスを用いた18〜19世紀英語散文の文体研究
利用计算机语料库对18-19世纪英语散文进行文体研究
  • 批准号:
    12710254
  • 财政年份:
    2000
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

イギリス児童文学黎明期の女性作家の形容詞と文体:コーパス文体論からのアプローチ
英国儿童文学早期女性作家的形容词和写作风格:语料库文体学的方法
  • 批准号:
    23K00596
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
中世日本語文体の計量的研究
中世纪日本写作风格的定量研究
  • 批准号:
    22KJ2641
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
中世語・近世語におけるコロケーションの文体差および位相差に関する研究
中世纪和近代早期语言搭配的文体差异和相位差异研究
  • 批准号:
    23K00564
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
外国ルーツ高校生の日本語作文の実態調査と日本語教育のための語彙・文法の基礎研究
外籍高中生日语作文调查及日语教育词汇语法基础研究
  • 批准号:
    23K12219
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
A stylistic analysis of 21st-century present-tense fiction
21世纪现在时小说的文体分析
  • 批准号:
    21K00573
  • 财政年份:
    2021
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了