Workshop: Developing collection management tools to create more robust and reliable linguistic data

研讨会:开发馆藏管理工具以创建更强大、更可靠的语言数据

基本信息

  • 批准号:
    1648984
  • 负责人:
  • 金额:
    $ 10.86万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-15 至 2023-07-31
  • 项目状态:
    已结题

项目摘要

The world's linguistic and cultural diversity is encoded in the approximately 7,000 distinct languages spoken across the world. With many of these languages currently endangered or threatened, the creation of an enduring record of these language is of paramount importance. Endangered language documentation includes many elements, including raw audio and video recordings, photographs, transcription files, databases, files containing linguistic analysis and other research details, responses to experimental stimuli, and field observations. Together these files make up a collection of interlinked data for a particular project. For example, recordings go along with their transcriptions, and data in the transcriptions is added to databases. Managing all these kinds of data is necessary before archiving and making the data widely accessible. Researchers in the language sciences manage a large amount of interlinked data prior to depositing it in an archive. However, there are no guidelines for best practices for this type of collection and there are no standard tools for managing the files. As a result, current practices are inefficient and create bottlenecks that delay archiving. This project will use workshops to bring together stakeholders in language documentation, including software developers, to develop standardized software tools to address the hold-ups that have the potential to prevent research products from being properly archived and thus publicly accessible.The workshop series proposed here addresses this obstacle by developing standardized tools for management of linguistic data collections. Such tools will facilitate a more robust and reproducible science of language by providing researchers with standard methods to manage data from the point of collection to the point of archive deposit. The aim is to eliminate the collection management bottleneck and to facilitate greater uptake of language archives. The workshop series will bring together relevant stakeholders including: field linguists who collect data; theoretical linguists who make use of archival linguistic data; experts in data curation; and software developers. In order to encourage broad participation, the three workshops will be scheduled in conjunction with major gatherings of linguistic researchers, including the Linguistic Society of America annual meeting. The outcome of these workshops will be a sustainable plan for development of a cross-platform, open source collection management tool. By making data more accessible and better described this tool will facilitate increased reproducibility and accessibility of linguistic research. This greater availability of primary language resources will transform not only various subfields of linguistics, but also related fields such as anthropology and social psychology, which rely on careful management of field data. Further, by taking a stakeholder-driven approach via a series of workshops, the project has the potential to encourage broad adoption of collection management tools by both the language documentation community and by linguists representative of other subdisciplines. In doing so, the project will decrease the barriers to proper description and archiving of linguistic data of a wide variety. Moreover, by improving the dialogue between language documenters, language archivists, linguists and developers, this project will serve as a model for the development of software in linguistics, as well as other social and behavioral sciences.
世界上大约7,000种不同的语言在世界各地使用的语言和文化多样性编码。由于目前许多这些语言受到威胁或威胁,创建这些语言的持久记录至关重要。 濒危语言文档包括许多元素,包括原始音频和视频记录,照片,转录文件,数据库,包含语言分析的文件和其他研究细节,对实验刺激的响应以及现场观察。 这些文件共同构成了特定项目的相互联系数据的集合。例如,录音与它们的转录一起进行,并将转录中的数据添加到数据库中。 在归档并使数据可广泛访问之前,必须管理所有此类数据。语言科学领域的研究人员在将其存入档案中之前管理大量相互联系的数据。但是,没有针对此类集合的最佳实践指南,也没有用于管理文件的标准工具。结果,当前的做法效率低下,并创建延迟存档的瓶颈。该项目将使用研讨会将包括软件开发人员在内的语言文档中的利益相关者汇集在一起​​,以开发标准化的软件工具,以解决有可能防止研究产品正确归档并因此公开访问的持有的持有。此处提出的研讨会系列通过开发标准化的语言数据收集的工具来解决此障碍。这样的工具将通过为研究人员提供从收集点到存档存款点管理数据的标准方法,从而促进更强大和更可重复的语言科学。目的是消除藏品管理瓶颈,并促进更大的语言档案用途。研讨会系列将汇集相关的利益相关者,包括:收集数据的现场语言学家;利用档案语言数据的理论语言学家;数据策展专家;和软件开发人员。为了鼓励广泛的参与,这三个研讨会将与语言研究人员(包括美国语言学会年度大会)的主要聚会一起安排。这些研讨会的结果将是开发跨平台开源收集管理工具的可持续计划。通过使数据更容易访问和更好地描述,该工具将有助于增加语言研究的可重复性和可访问性。基本语言资源的这种更大的可用性不仅会改变语言学的各种子场,还会改变相关领域,例如人类学和社会心理学,这些领域依赖于仔细的现场数据管理。此外,通过通过一系列研讨会采用利益相关者驱动的方法,该项目有可能鼓励语言文档社区和代表其他子学科的语言学家广泛采用收集管理工具。 这样一来,该项目将减少各种各样的语言数据的正确描述和归档。此外,通过改善语言记录员,语言档案管理员,语言学家和开发人员之间的对话,该项目将成为语言学以及其他社会和行为科学领域软件开发的模型。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Developing collection management tools to create more robust and reliable linguistic data
开发馆藏管理工具以创建更强大、更可靠的语言数据
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Gary Holton其他文献

Public access to research data in language documentation: Challenges and possible strategies
公众获取语言文献中的研究数据:挑战和可能的策略
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mandana Seyfeddinipur;F. Ameka;Lissant M Bolton;J. Blumtritt;B. Carpenter;Hilaria Cruz;Sebastian Drude;Patience Epps;Vera Ferreira;Ana Vilacy Moreira Galúcio;Brigit Hellwig;Oliver Hinte;Gary Holton;Dagmar Jung;Irmgarda Kasinskaite Buddeberg;M. Krifka;S. Kung;Miyuki Monroig;A. N. Neba;S. Nordhoff;B. Pakendorf;Kilu von Prince;F. Rau;K. Rice;Michael Rießler;Vera Szoelloesi Brenig;N. Thieberger;Paul Trilsbeek;H. V. D. Voort;Tonya Woodbury
  • 通讯作者:
    Tonya Woodbury
SPLIT INTRANSITIVITY IN CANTONESE
粤语中的不及物性分割
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    V. Anderson;Andrea L. Berez;R. Blust;K. Deen;K. Drager;Shelece Easterday;Shinichiroh Fukuda;Gary Holton;Bradley McDonnell;William O’Grady;A. Schafer;J. Woodward;Jennifer Sou
  • 通讯作者:
    Jennifer Sou
Indigenous Peoples, Ethics, and Linguistic Data
原住民、伦理和语言数据
Kinship in the Alor-Pantar languages
阿罗班塔语中的亲属关系
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gary Holton
  • 通讯作者:
    Gary Holton
The rise and fall of semantic alignment in North Halmahera, Indonesia
印度尼西亚北哈马黑拉语义对齐的兴衰
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Gary Holton
  • 通讯作者:
    Gary Holton

Gary Holton的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Gary Holton', 18)}}的其他基金

Doctoral Dissertation Research: A Multi-Modal Study of Gesture in a Spatial Language
博士论文研究:空间语言中手势的多模态研究
  • 批准号:
    2025315
  • 财政年份:
    2020
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Standard Grant
Doctoral Dissertation Research: Syntactic Description of a Language with Unique Patterns of Symmetrical Voice Alternations
博士论文研究:具有独特的对称语音交替模式的语言的句法描述
  • 批准号:
    1926376
  • 财政年份:
    2019
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Standard Grant
DDRIG: Northern Dene Astronomy
DDRIG:北德内天文学
  • 批准号:
    1753650
  • 财政年份:
    2018
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Standard Grant
Conference on Minority Language Documentation for Community Language Practitioners
社区语言从业者少数民族语言文献会议
  • 批准号:
    1761223
  • 财政年份:
    2018
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Standard Grant
The 2019 International Conference on Language Documentation & Conservation: Connecting Languages, Communities, and Technology
2019年国际语言文献会议
  • 批准号:
    1745711
  • 财政年份:
    2017
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Standard Grant
Completion of Eyak (ISO 693-3 eya) Grammar, Dictionary, Texts
完成 Eyak (ISO 693-3 eya) 语法、词典、文本
  • 批准号:
    1642783
  • 财政年份:
    2016
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Continuing Grant
DDRIG: Illiamna Yup'ik Geographic Knowledge and Sense of Place in Southwest Alaska
DDRIG:伊利亚姆纳·尤皮克(Illiamna Yupik)阿拉斯加西南部的地理知识和地方感
  • 批准号:
    1640812
  • 财政年份:
    2016
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Standard Grant
Collaborative Research: Linking Maps, Manuscripts, and Place Names Data to Improve Environmental Knowledge in Alaska
合作研究:链接地图、手稿和地名数据以提高阿拉斯加的环境知识
  • 批准号:
    1624365
  • 财政年份:
    2015
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Continuing Grant
Collaborative Research: Workshop on User-Centered Design of Language Archives
合作研究:以用户为中心的语言档案设计研讨会
  • 批准号:
    1543828
  • 财政年份:
    2015
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Standard Grant
Collaborative Research: Linking Maps, Manuscripts, and Place Names Data to Improve Environmental Knowledge in Alaska
合作研究:链接地图、手稿和地名数据以提高阿拉斯加的环境知识
  • 批准号:
    1415603
  • 财政年份:
    2014
  • 资助金额:
    $ 10.86万
  • 项目类别:
    Continuing Grant

相似国自然基金

剪接因子SNRPA1通过调节R-loop稳态影响肺腺癌发展进程的机制研究
  • 批准号:
    32360143
  • 批准年份:
    2023
  • 资助金额:
    32 万元
  • 项目类别:
    地区科学基金项目
GGPP变构激活FBP1偶联葡萄糖代谢和胆固醇合成途径抑制NAFL-NASH发展的机制研究
  • 批准号:
    32371366
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
企业层面视角下自由贸易协定条款深度对出口高质量发展的影响:模型拓展与量化分析
  • 批准号:
    72363013
  • 批准年份:
    2023
  • 资助金额:
    27 万元
  • 项目类别:
    地区科学基金项目
新型城镇化与区域协调发展的机制与治理体系研究
  • 批准号:
    72334006
  • 批准年份:
    2023
  • 资助金额:
    167 万元
  • 项目类别:
    重点项目
亦正亦邪Sirt6:Sirt6调控谷氨酰胺代谢促进肝内胆管癌发生发展的分子机制研究
  • 批准号:
    82372667
  • 批准年份:
    2023
  • 资助金额:
    49 万元
  • 项目类别:
    面上项目

相似海外基金

Developing climate cohorts to understand health associations and resilience and susceptibility factors in Ghana
开发气候队列以了解加纳的健康关联以及复原力和易感性因素
  • 批准号:
    10838923
  • 财政年份:
    2022
  • 资助金额:
    $ 10.86万
  • 项目类别:
UA Research Project: Developing policy recommendations: Indigenous leader and individuals' perspectives on research, governance, and data sharing in Arizona
亚利桑那大学研究项目:制定政策建议:土著领导人和个人对亚利桑那州研究、治理和数据共享的看法
  • 批准号:
    10223678
  • 财政年份:
    2021
  • 资助金额:
    $ 10.86万
  • 项目类别:
UA Research Project: Developing policy recommendations: Indigenous leader and individuals' perspectives on research, governance, and data sharing in Arizona
亚利桑那大学研究项目:制定政策建议:土著领导人和个人对亚利桑那州研究、治理和数据共享的看法
  • 批准号:
    10493143
  • 财政年份:
    2021
  • 资助金额:
    $ 10.86万
  • 项目类别:
Children's Exposure to Indoor and Outdoor Air Pollution within the SHEAR Project in Rwanda
卢旺达 SHEAR 项目中儿童接触室内和室外空气污染的情况
  • 批准号:
    10615232
  • 财政年份:
    2021
  • 资助金额:
    $ 10.86万
  • 项目类别:
Children's Exposure to Indoor and Outdoor Air Pollution within the SHEAR Project in Rwanda
卢旺达 SHEAR 项目中儿童接触室内和室外空气污染的情况
  • 批准号:
    10296696
  • 财政年份:
    2021
  • 资助金额:
    $ 10.86万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了