Automatic Multilingual Subtitling of Lecture Videos Towards University Globalization

讲座视频自动多语言字幕迈向大学全球化

基本信息

项目摘要

“いつでも,どこでも,だれにでも”同等の教育の機会を提供することは非常に重要である.国連サミットにて採択されたSDGsにおいても,「質の高い教育をみんなに」は,今後の持続可能な社会における重要な政策目標の一つとなっている.また,海外からの留学性や教員も利用することを考慮すると,字幕に対して翻訳を行うことも必要な要素である.現に,私が以前,担当していたUTokyo OCWサイトに併設されているSNSには,国内外より,聴覚障害者からの字幕付与,言語習得も含めた学習教材化,等への要望も多く寄せられていた.しかしながら,講義映像が短時間で少量であれば人手で行うことも可能であるが,一般に高コストであり,本研究開発において期待されるような多数の講義映像に対して行うことは難しい.そこで映像音声に対して自動的に音声認識を行い,その結果を字幕として表示,あるいはその結果に対して人手により修正を行うことで字幕とする等の手法の研究開発が行われている.しかしながら,音声認識システムの認識精度は年々向上してはいるものの,そのまま字幕として使用するには未だ十分な精度とは言い難い.特に,本研究で対象とする高等教育での講義映像の音声には専門用語が多く含まれており,認識できない用語があるのに加え,字幕として利用するためには同音異義語も正しく漢字へと変換することが必要となる。この解決には、講義で話されているテキストを大量に収集し、分析を行い、言語モデルを再構成することが望ましい。そこで、昨年度は、サイバー大学より講義ビデオの提供をいただく契約を行い、約100時間分の講義ビデオを収集することに成功した。また、情報通信研究機構(NICT)との共同により、収集した講義ビデオからの音声テキストデータの抽出を進めており、適宜、音声翻訳の精度向上のためのデータとして利用する準備が整ったと言える。
在任何人,任何人,任何人的任何时候都提供平等的教育机会非常重要。即使在联合国峰会上通过的可持续发展目标,“每个人的高质量教育”也已成为未来可持续社会的重要政策目标之一。此外,考虑到从海外出国留学的能力以及使用海外教师的使用,字幕的翻译也是必要的因素。实际上,我曾经负责Utokyo OCW网站附加到Utokyo OCW网站上的社交网站收到了国内和国际上的许多请求,以授予听力受损的人的字幕,并将其用作学习材料,包括语言获取。但是,尽管可以手动进行讲座镜头,如果讲座的数量短而小,但通常很昂贵且难以执行大量的演讲录像,这在本研究和开发中可以预期。因此,正在以自动识别视频和音频等方法,将结果显示为字幕或手动修改结果以成为字幕等方法进行研究和开发。但是,尽管语音识别系统的识别精度逐年提高,但仍然很难说它足够准确,可以用作字幕。特别是,高等教育中的演讲视频音频(这是本研究的主题)包含许多技术术语,除了无法识别某些术语的事实外,还必须正确地将同音词转换为汉字,以用作字幕。为了解决这个问题,希望收集在讲座中使用的大量文本,进行分析并重建语言模型。因此,去年,我们签署了网络大学的合同,以提供讲座视频,并设法收集了大约100个小时的演讲视频。此外,与日本信息与通信技术学院(NICT)合作,我们现在正在从收集的教学视频中提取音频文本数据,可以说我们准备将其用作数据以在适当时提高语音翻译的准确性。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
MIMAサーチによる文書情報の可視化
使用 MIMA 搜索可视化文档信息
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    後藤 裕介;森田 裕之;白井 康之;市川 尚;濱田 直希;原田 智広;美馬秀樹
  • 通讯作者:
    美馬秀樹
自律的学習を育成する履修計画支援プログラムの開発と効果検証
促进自主学习的课程规划支持计划的开发和有效性验证
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    五島譲司;中道雅樹;美馬秀樹;津田純子
  • 通讯作者:
    津田純子
自動分類の応用可能性――大学カリキュラムの可視化・比較へのNDCの活用実験
应用自动分类的可能性:使用 NDC 可视化和比较大学课程的实验
『MIMAサーチ』による学術会議の可視化
使用“MIMA搜索”可视化学术会议
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomomichi Kawamata;Loui Lord Nelson;Shizuko Kame Barnes;岡田佳子・松田稔樹;山本真優,山本朋弘;美馬秀樹
  • 通讯作者:
    美馬秀樹
オンライン授業を取り巻く環境
网课周边环境
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Okada;Y. & Matsuda;T.;美馬秀樹
  • 通讯作者:
    美馬秀樹
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

美馬 秀樹其他文献

美馬 秀樹的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('美馬 秀樹', 18)}}的其他基金

ゲノム分野におけるオントロジーを基にした知識自動獲得と知識の構造化に関する研究
基因组学领域基于本体的自动知识获取与知识结构化研究
  • 批准号:
    15700243
  • 财政年份:
    2003
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

授業における非言語モダリティセンシングの高度化による情報保障・授業改善支援技術
通过提高课程中非语言情态感知的复杂性来支持信息安全和课程改进技术
  • 批准号:
    21H00901
  • 财政年份:
    2021
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study of Information Access by making use of Latent Spaces shared across Modalities and Languages
利用跨模式和语言共享的潜在空间进行信息访问的研究
  • 批准号:
    19K11980
  • 财政年份:
    2019
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Automatic generation of lecture's materials with Japanese caption based on English lecture's speech translation and speech summarization
基于英语讲座语音翻译和语音摘要自动生成日文字幕讲座材料
  • 批准号:
    18H01062
  • 财政年份:
    2018
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study of automatic English caption generation for Japanese lecture speech
日语讲座演讲自动生成英文字幕的研究
  • 批准号:
    25280062
  • 财政年份:
    2013
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Simultaneous speech translation methods for news and lectures in foreign languages
外语新闻和讲座的同声翻译方法
  • 批准号:
    24240032
  • 财政年份:
    2012
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了