日本語と英語のパラレルコーパスを用いた言い淀みの対照言語学的研究

使用日语和英语平行语料库进行犹豫的比较语言研究

基本信息

项目摘要

不自然に長いポーズやフィラーなどの言い淀み(非流暢性)は自発発話に固有の特徴で朗読音声にはほとんど現れない。このような非流暢性は相手のある発話をタイミングよく続けなければならないというオンライン発話生成に関連した現象と考えられている。このような現象はどこまでが言語普遍的でありどこからが各言語に固有のものだろうか。この問題にアプローチするため,本プロジェクトでは対照研究か可能になるような日英語の話し言葉コーパスを構築し,両者におけるポーズやフィラーの出現の仕方を調べてきた。コーパスは,日本語は『日本語話し言葉コーパス(CSJ)』の一部を用いた。英語は,CSJ中の「模擬講演」と対照可能になるよう話者特性と講演内容を選定し,20名のアメリカ英語話者による『英語話し言葉コーパス(COPE)』を構築した。そして,両コーパスにおけるポーズとフィラーの出現形態を節境界,文境界を中心に調べ比較した。その結果,まず,無音区間長の総計が発話全体に占める割合は英語よりも日本語の方が有意に大きいことがわかった。これは,日本語話者の方が間の多い発話をしていることを示唆している。一方で,フィラー長の総計の割合と語あたりの頻度に両言語間で有意差はなかった。これらの結果から,両言語の発話の仕方の違いは主にポーズの取り方の違いに現れることが推測された。そこで,発話生成単位の一つと考えられている節の境界に着目し,そこにおけるポーズの出現率と長さ,ならびにフィラーの出現率を調べ,両言語間で比較した。その結果,英語ではポーズのない節境界が日本語の倍以上あり,英語の無音区間の割合の小ささはこのことに起因していることが推察された。一方,ポーズ長に呼応して後続フィラーの出現率が上昇する点は両言語で共通していた。このことから,どちらの言語においてもフィラーが不自然な間を埋める役割を担っていることが示唆された。
不流畅,例如不自然的长时间停顿和填充物,是自发演讲所特有的特征,很少出现在背诵的演讲中。这种不流畅被认为是与在线语音生成有关的现象,其中一个人必须及时地继续某种话语。这些现象在多大程度上是跨语言的普遍现象,在多大程度上是每种语言所独有的?为了解决这个问题,该项目构建了一个日语-英语口语语料库,可以进行比较研究,并研究了停顿和填充词在两种语言中是如何出现的。对于日语,使用了日语口语语料库(CSJ)的一部分。对于英语,我们选择了演讲者的特征和讲座内容,以便与CSJ期间的“模拟讲座”进行比较,并由20名美国英语演讲者构建了“英语口语语料库(COPE)”。然后,我们研究并比较了两个语料库中停顿和填充词的出现,重点关注从句边界和句子边界。结果首先显示,日语中总沉默区间长度占总话语量的比例明显大于英语。这表明说日语的人发出的话语中有更多的停顿。另一方面,两种语言之间填充长度的总百分比和每个单词的频率没有显着差异。从这些结果推断,两种语言说话方式的差异主要是由于姿势方式的差异。因此,我们重点关注被认为是话语产生单位之一的子句的边界,调查停顿的发生率和长度以及填充词的发生率,并在两种语言之间进行比较。结果显示,英语中无停顿的分句边界数量是日语的两倍多,推测这就是英语中无声间隔比例较小的原因。另一方面,两种语言都有一个事实,即后续填充词的出现率随着停顿长度的增加而增加。这表明填充词在填补两种语言中不自然的空白方面发挥着作用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Applying speech synthesis technology to assisting prosody learning
应用语音合成技术辅助韵律学习
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Watanabe;M.
  • 通讯作者:
    M.
Uh is preferred by male speakersin informal presentations in American English
在美式英语的非正式演讲中,男性演讲者更喜欢“Uh”
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Watanabe;M.;Korematsu;Y.;Shirahata;Y.
  • 通讯作者:
    Y.
Automated real-time feedback on second language speech fluency
第二语言语音流利度自动实时反馈
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rose;R.
  • 通讯作者:
    R.
Ethical Considerations in the Use of Disfluencies in AI-generated Speech
在人工智能生成的语音中使用不流利的道德考虑
節中のフィラー「エー」「アノー」「マー」の出現確率に関係する要因
与子句中填充词“A”、“Ano”和“Ma”出现概率相关的因素
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Watanabe;M.;渡辺美知子・白旗悠真
  • 通讯作者:
    渡辺美知子・白旗悠真
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

渡辺 美知子其他文献

音声聴取時のフィラーの働き : 「エート」による後続句の複雑さ予測
语音聆听过程中填充词的功能:使用“eto”预测后续短语的复杂性
  • DOI:
    10.20697/jasj.62.5_370
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    渡辺 美知子;啓吉 広瀬;康晴 伝;信明 峯松
  • 通讯作者:
    信明 峯松
STDP則に基づく大脳皮質ニューラルネットワークの提案
基于STDP规则的大脑皮层神经网络的提出
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岩館 健司;鈴木 育男;渡辺 美知子;山本 雅人;古川 正志
  • 通讯作者:
    古川 正志

渡辺 美知子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('渡辺 美知子', 18)}}的其他基金

ニューロモデルに進化計算を用いた高速学習の自律型移動ロボットの開発
利用神经模型中的进化计算开发具有高速学习功能的自主移动机器人
  • 批准号:
    19921017
  • 财政年份:
    2007
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
免疫アルゴリズムと自己組織化マップを用いたスケジュールの知識獲得
使用免疫算法和自组织图安排知识获取
  • 批准号:
    16919095
  • 财政年份:
    2004
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
GAを用いたスキルフル・スケジューリング法の開発
利用遗传算法开发巧妙的调度方法
  • 批准号:
    13919005
  • 财政年份:
    2001
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (B)
機械学習のQ−Learningによる自律分散移動ロボットの開発
使用 Q-Learning 机器学习开发自主分布式移动机器人
  • 批准号:
    10919004
  • 财政年份:
    1998
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (B)

相似海外基金

日英語の小説表現に基づく認知言語学的対照研究
基于日语和英语小说表达的认知语言比较研究
  • 批准号:
    24K03943
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The Construction of Multi-language Considerate Expressions Database and the Compilation of Considerate Expressions Dictionary
多语言体贴表达数据库的构建及体贴表达词典的编写
  • 批准号:
    22H00670
  • 财政年份:
    2022
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Novels and Data Sciences: Mindscape Seen in Language
小说与数据科学:语言中的思维景观
  • 批准号:
    20K20699
  • 财政年份:
    2020
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
省略現象における日英語対照とその獲得研究
日英遗漏现象对比及其习得研究
  • 批准号:
    20K00678
  • 财政年份:
    2020
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Ideophoneと言語進化に関する日英対照を中心にした語用論・類型論的研究
语用学和类型学研究,重点关注日语和英语在表意音和语言演化方面的对比
  • 批准号:
    19K00681
  • 财政年份:
    2019
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了