Sprecherunabhängige Gebärdenspracherkennung mit großem Vokabular auf der Basis von Untereinheiten-Modellen

基于子单元模型的大词汇量与说话人无关的手语识别

基本信息

项目摘要

Gegenwärtig wird ein bestehendes System zur Erkennung der deutschen Gebärdensprache weiterentwickelt, welches simultan Gestik und Mimik eines Gebärdensprechers videobasiert erfassen kann. Unter Verwendung von Ganzwortmodellen werden kontinuierliche Gebärdensätze sprecherabhängig mit einer Akkuratheit von 91,9% erkannt. Es wird erwartet, dass sich durch eine Unterteilung von Gebärden in kleinere Untereinheiten – ähnlich den Phonemen in der Lautsprache – der Trainingsaufwand erheblich reduzieren lässt. Im Rahmen des Projekts konnten auf dem Weg zur sprecherunabhängigen Erkennung eines großen Vokabulars auf Basis von Untereinheiten-Modellen bereits viele Teilziele erfolgreich umgesetzt werden. Der im Aufbau befindliche Gebärdensprachkorpus ist in seinem Umfang, was die Größe des Vokabulars und der Trainingspopulation betrifft, weltweit einzigartig. Eine Merkmalsnormierung und -selektion führte zu einer Steigerung der sprecherunabhängigen Erkennungsleistung von 45,5 % auf 68,1 %. Eine weitere Steigerung ergibt sich durch den Einsatz eines kombinierten Ansatzes zur Sprecheradaption, der eine schnelle Adaption der Modelle an einen unbekannten Sprecher gewährleistet. Das entwickelte Verfahren zur automatischen Transkription von Gebärden in Untereinheiten ermöglicht derzeit, für einen Sprecher bei verschiedenen Ausführungen derselben Gebärde eine recht stabile Unterteilung zu erhalten. Zwischen den Sprechern allerdings unterscheiden sich die Transkriptionen bislang noch teils sehr deutlich. Die Behandlung dieses Problems ist daher das primäre Ziel des vorliegenden Fortsetzungsantrags. Die Umsetzung erfordert eine weiterführende Erforschung sprecherinvarianter Merkmale sowie geeigneter Verfahren zur Sprechernormierung. Zudem muss der Gebärdensprachkorpus um weitere Trainingssprecher erweitert werden, um ein stabiles Aussprachelexikon schätzen zu können. Die automatische Transkription von Gebärden soll zukünftig nicht mehr rein datengetrieben erfolgen sondern auch Erkenntnisse aus manuell durchgeführten Unterteilungen einbeziehen. Ferner wird ein Speaker Clustering Verfahren zur schnellen Sprecheradaption implementiert, das von einer erweiterten Trainingspopulation profitiert.
Unter Verwendung von Ganzwortmodellen werden kontinuierliche Gebärdensätze 91.9% 的时间都是我。 Rahmen des Projekts konnten auf dem sprecherunabhängigen Erkennung eines großen Vokabulars auf Basis von Untereinheiten-Modellen bereits viele Teilziele erfolgreich umgesetzt werden。 Umfang,是die Größe des Vokabulars und der Trainingspopulation betrifft,weltweit einzigartig。在此情况下,所有的应用程序都需要对 Sprecheradaption 进行组合分析,以适应不同的场景。在此期间,您的施普雷彻将在法律上保持稳定。 primäre Ziel des vorliegenden Fortsetzungsantrags。稳定 Aussprachelexikon schätzen zu können。 Schnellen Sprecheradaption 实施者,das von einer erweiterten 培训人口受益。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr.-Ing. Karl-Friedrich Kraiss其他文献

Professor Dr.-Ing. Karl-Friedrich Kraiss的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr.-Ing. Karl-Friedrich Kraiss', 18)}}的其他基金

Dynamische Einsatzsimulation kooperierender mobiler Roboter
协作移动机器人动态运行仿真
  • 批准号:
    5316018
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Bildgestütztes Training mobiler Service-Roboter in virtuellen Welten
虚拟世界中基于图像的移动服务机器人训练
  • 批准号:
    5311520
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Videobasierte Erfassung von Gestik und Mimik für die Gebärdenpracherkennung
基于视频捕获手势和面部表情以进行手语识别
  • 批准号:
    5292154
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似海外基金

Kryomessstand für temperaturabhängige Leitfähigkeits- und Hall-Messungen
低温测定法适用于温度相关的电导率和霍尔测量
  • 批准号:
    236062596
  • 财政年份:
    2013
  • 资助金额:
    --
  • 项目类别:
    Major Research Instrumentation
Nutzungsabhängige Simulation zur antizipativen Veränderungsplanung intralogistischer Systeme (Kurztitel: Antizipative Veränderungsplanung)
内部物流系统预期变更规划的依赖于使用的模拟(简称:预期变更规划)
  • 批准号:
    197070290
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Flavin-abhängige Monooxygenasen in Insekten - Struktur, Spezifität, Evolution
昆虫黄素依赖性单加氧酶 - 结构、特异性、进化
  • 批准号:
    211170361
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Grants
k-abhängige optische Eigenschaften metall-dielektrischer Nanostrukturen
金属介电纳米结构的 k 相关光学特性
  • 批准号:
    189200452
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Nitrit-abhängige NO-Bioaktivität in der Zirkulation: Rolle von Hämoglobin, Carboanhydase und NO-Synthase
循环中亚硝酸盐依赖性 NO 生物活性:血红蛋白、碳酸酐酶和 NO 合酶的作用
  • 批准号:
    199849202
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了