日本語と英語のパラレルコーパスを用いた言い淀みの対照言語学的研究

使用日语和英语平行语料库进行犹豫的比较语言研究

基本信息

项目摘要

不自然に長いポーズやフィラーなどの言い淀み(非流暢性)は自発発話に固有の特徴で朗読音声にはほとんど現れない。このような非流暢性は相手のある発話をタイミングよく続けなければならないというオンライン発話生成に関連した現象と考えられている。このような現象はどこまでが言語普遍的でありどこからが各言語に固有のものだろうか。この問題にアプローチするため,本プロジェクトでは対照研究か可能になるような日英語の話し言葉コーパスを構築し,両者におけるポーズやフィラーの出現の仕方を調べてきた。コーパスは,日本語は『日本語話し言葉コーパス(CSJ)』の一部を用いた。英語は,CSJ中の「模擬講演」と対照可能になるよう話者特性と講演内容を選定し,20名のアメリカ英語話者による『英語話し言葉コーパス(COPE)』を構築した。そして,両コーパスにおけるポーズとフィラーの出現形態を節境界,文境界を中心に調べ比較した。その結果,まず,無音区間長の総計が発話全体に占める割合は英語よりも日本語の方が有意に大きいことがわかった。これは,日本語話者の方が間の多い発話をしていることを示唆している。一方で,フィラー長の総計の割合と語あたりの頻度に両言語間で有意差はなかった。これらの結果から,両言語の発話の仕方の違いは主にポーズの取り方の違いに現れることが推測された。そこで,発話生成単位の一つと考えられている節の境界に着目し,そこにおけるポーズの出現率と長さ,ならびにフィラーの出現率を調べ,両言語間で比較した。その結果,英語ではポーズのない節境界が日本語の倍以上あり,英語の無音区間の割合の小ささはこのことに起因していることが推察された。一方,ポーズ長に呼応して後続フィラーの出現率が上昇する点は両言語で共通していた。このことから,どちらの言語においてもフィラーが不自然な間を埋める役割を担っていることが示唆された。
不自然的长姿势和填充物是自发的演讲中固有的,在阅读声音中很少见。这种类型的非权利被认为是与在线话语产生相关的一种现象,在这种现象中,对方必须一次继续讲话。这种现象通用有多远,每种语言在哪里独一?为了解决这个问题,该项目构建了一个日本英语口语语料库,该语言可能是一项控制研究,并检查了两者中姿势和填充物的方式。该语料库将“口语日本语料库(CSJ)”的一部分用于日语。选择了演讲者的特征和内容,以便可以将英语与CSJ的“模拟演讲”形成鲜明对比,并且由20位美国英语说话者构建了“说英语语料库(COPE)”。然后检查并比较两个语料库中的姿势和填充物的外观,重点是节点边界和句子边界。结果表明,沉默的间隔总数分解了日语中语音总数明显大于英语。这表明日本人的演讲更频繁。另一方面,两种语言之间在填充长度的总比例和每个单词频率的总比例中没有显着差异。这些结果表明,两种语言说话的方式的差异主要反映在姿势的方式中。因此,我们专注于条款的边界,该条款被认为是产生单元的语音,并检查了姿势的出现率和长度以及填充物的发生率,并在两种语言之间进行了比较。结果,据估计,用英语,条款的边界没有比日语的两倍以上,这是英语中静音间隔的一小部分。另一方面,两种语言都有一个共同点,即随后的填充物的发生率会响应暂停长度而增加。这表明填充物在两种语言的非自然空间中都起着作用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Applying speech synthesis technology to assisting prosody learning
应用语音合成技术辅助韵律学习
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Watanabe;M.
  • 通讯作者:
    M.
Automated real-time feedback on second language speech fluency
第二语言语音流利度自动实时反馈
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rose;R.
  • 通讯作者:
    R.
Uh is preferred by male speakersin informal presentations in American English
在美式英语的非正式演讲中,男性演讲者更喜欢“Uh”
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Watanabe;M.;Korematsu;Y.;Shirahata;Y.
  • 通讯作者:
    Y.
Ethical Considerations in the Use of Disfluencies in AI-generated Speech
在人工智能生成的语音中使用不流利的道德考虑
節中のフィラー「エー」「アノー」「マー」の出現確率に関係する要因
与子句中填充词“A”、“Ano”和“Ma”出现概率相关的因素
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Watanabe;M.;渡辺美知子・白旗悠真
  • 通讯作者:
    渡辺美知子・白旗悠真
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

渡辺 美知子其他文献

音声聴取時のフィラーの働き : 「エート」による後続句の複雑さ予測
语音聆听过程中填充词的功能:使用“eto”预测后续短语的复杂性
  • DOI:
    10.20697/jasj.62.5_370
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    渡辺 美知子;啓吉 広瀬;康晴 伝;信明 峯松
  • 通讯作者:
    信明 峯松
STDP則に基づく大脳皮質ニューラルネットワークの提案
基于STDP规则的大脑皮层神经网络的提出
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岩館 健司;鈴木 育男;渡辺 美知子;山本 雅人;古川 正志
  • 通讯作者:
    古川 正志

渡辺 美知子的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('渡辺 美知子', 18)}}的其他基金

ニューロモデルに進化計算を用いた高速学習の自律型移動ロボットの開発
利用神经模型中的进化计算开发具有高速学习功能的自主移动机器人
  • 批准号:
    19921017
  • 财政年份:
    2007
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
免疫アルゴリズムと自己組織化マップを用いたスケジュールの知識獲得
使用免疫算法和自组织图安排知识获取
  • 批准号:
    16919095
  • 财政年份:
    2004
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
GAを用いたスキルフル・スケジューリング法の開発
利用遗传算法开发巧妙的调度方法
  • 批准号:
    13919005
  • 财政年份:
    2001
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (B)
機械学習のQ−Learningによる自律分散移動ロボットの開発
使用 Q-Learning 机器学习开发自主分布式移动机器人
  • 批准号:
    10919004
  • 财政年份:
    1998
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (B)

相似海外基金

日英語の小説表現に基づく認知言語学的対照研究
基于日语和英语小说表达的认知语言比较研究
  • 批准号:
    24K03943
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
The Construction of Multi-language Considerate Expressions Database and the Compilation of Considerate Expressions Dictionary
多语言体贴表达数据库的构建及体贴表达词典的编写
  • 批准号:
    22H00670
  • 财政年份:
    2022
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Novels and Data Sciences: Mindscape Seen in Language
小说与数据科学:语言中的思维景观
  • 批准号:
    20K20699
  • 财政年份:
    2020
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
省略現象における日英語対照とその獲得研究
日英遗漏现象对比及其习得研究
  • 批准号:
    20K00678
  • 财政年份:
    2020
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Ideophoneと言語進化に関する日英対照を中心にした語用論・類型論的研究
语用学和类型学研究,重点关注日语和英语在表意音和语言演化方面的对比
  • 批准号:
    19K00681
  • 财政年份:
    2019
  • 资助金额:
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了