TRANSFORMATIVE TECHNOLOGIES - Mining for the best side of bioscience data, with machine learning
变革性技术 - 通过机器学习挖掘生物科学数据的最佳一面
基本信息
- 批准号:2890716
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:英国
- 项目类别:Studentship
- 财政年份:2023
- 资助国家:英国
- 起止时间:2023 至 无数据
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Biology is being transformed by large-scale data sets, but how do you find the right one? The data needs a 'dating profile': sounds easy but it turns out to be a bottleneck that is holding back research progress and research culture. This project tackles that metadata bottleneck. We aim to help researchers to show the best side of their data.Data-intensive bioscience depends upon online repositories that share the "Big Data". There's little value in sharing data, if you can't tell which organism, sample, or conditions it came from, so the databases also need descriptions of the data, termed metadata. Top-tier repositories pay professional data curators to deal with their metadata but many other repositories cannot do so. Even curators can't invent metadata, the original researchers have to describe their research for the curators. This project first aims to understand current data descriptions in research data repositories, using text mining and machine learning, in particular named entity recognition in free-text descriptions. Based on this evidence, you will research the simplest ways to improve the descriptions in future. The project will test real-time feedback that encourages researchers to provide better descriptions, for example using controlled vocabularies. You will work with software developers to test and evaluate simple feedback processes, in practice, for biological data repositories. By then, you will also be an expert data steward.Improving data descriptions will accelerate data-intensive bioscience across many research fields, as this bottleneck applies to many repositories and even electronic lab notebooks. Making the data easier to re-use will also reward the researchers who share their data, supporting the "Open Science" aspect of the new research culture.The team: Andrew Millar (Edinburgh) and Jason Swedlow (Dundee), are biologists who also develop and run data repositories, and help researchers to manage their data. We have access to internationally-adopted repositories (e.g. https://idr.openmicroscopy.org), their metadata, and to their software developers, who can help to implement feedback processes.Ian Simpson (Edinburgh Informatics) applies natural language processing (text mining) software tools to analyse bioscience literature, and has worked on several "Big Data" bioscience projects, including with Andrew Millar. The project is based with the BioRDM team in the C.H. Waddington building, at the focal point of SynthSys, the interdisciplinary biology research centre at the University of Edinburgh, where many labs generate, analyse and model large-scale biological data. More information at https://www.ed.ac.uk/biology/synthsys
大规模数据集正在改变生物学,但如何找到合适的数据集?数据需要“约会概况”:听起来很简单,但事实证明它是阻碍研究进展和研究文化的瓶颈。该项目解决了元数据瓶颈。我们的目标是帮助研究人员展示其数据最好的一面。数据密集型生物科学依赖于共享“大数据”的在线存储库。如果您无法分辨数据来自哪个生物体、样本或条件,那么共享数据就没有什么价值,因此数据库还需要数据的描述,称为元数据。顶级存储库支付专业数据管理员来处理其元数据,但许多其他存储库无法这样做。即使策展人也无法发明元数据,原始研究人员必须为策展人描述他们的研究。该项目首先旨在使用文本挖掘和机器学习,特别是自由文本描述中的命名实体识别,了解研究数据存储库中的当前数据描述。基于这些证据,您将研究未来改进描述的最简单方法。该项目将测试实时反馈,鼓励研究人员提供更好的描述,例如使用受控词汇。您将与软件开发人员合作,在实践中测试和评估生物数据存储库的简单反馈流程。到那时,您还将成为一名专家数据管理员。改进数据描述将加速许多研究领域的数据密集型生物科学,因为这个瓶颈适用于许多存储库甚至电子实验室笔记本。使数据更易于重复使用也将奖励共享数据的研究人员,支持新研究文化的“开放科学”方面。该团队:Andrew Millar(爱丁堡)和 Jason Swedlow(邓迪)是生物学家,他们也开发和运行数据存储库,并帮助研究人员管理他们的数据。我们可以访问国际采用的存储库(例如 https://idr.openmicroscopy.org)、其元数据以及可以帮助实施反馈流程的软件开发人员。Ian Simpson(爱丁堡信息学)应用自然语言处理(文本)挖掘)软件工具来分析生物科学文献,并参与了多个“大数据”生物科学项目,包括与安德鲁·米勒(Andrew Millar)合作。该项目基于 C.H. 的 BioRDM 团队。沃丁顿大楼位于爱丁堡大学跨学科生物学研究中心 SynthSys 的中心,许多实验室在这里生成、分析和建模大规模生物数据。更多信息请访问 https://www.ed.ac.uk/biology/synthsys
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
其他文献
Products Review
- DOI:
10.1177/216507996201000701 - 发表时间:
1962-07 - 期刊:
- 影响因子:2.6
- 作者:
- 通讯作者:
Farmers' adoption of digital technology and agricultural entrepreneurial willingness: Evidence from China
- DOI:
10.1016/j.techsoc.2023.102253 - 发表时间:
2023-04 - 期刊:
- 影响因子:9.2
- 作者:
- 通讯作者:
Digitization
- DOI:
10.1017/9781316987506.024 - 发表时间:
2019-07 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
References
- DOI:
10.1002/9781119681069.refs - 发表时间:
2019-12 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Putrescine Dihydrochloride
- DOI:
10.15227/orgsyn.036.0069 - 发表时间:
1956-01-01 - 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('', 18)}}的其他基金
An implantable biosensor microsystem for real-time measurement of circulating biomarkers
用于实时测量循环生物标志物的植入式生物传感器微系统
- 批准号:
2901954 - 财政年份:2028
- 资助金额:
-- - 项目类别:
Studentship
Exploiting the polysaccharide breakdown capacity of the human gut microbiome to develop environmentally sustainable dishwashing solutions
利用人类肠道微生物群的多糖分解能力来开发环境可持续的洗碗解决方案
- 批准号:
2896097 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
A Robot that Swims Through Granular Materials
可以在颗粒材料中游动的机器人
- 批准号:
2780268 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Likelihood and impact of severe space weather events on the resilience of nuclear power and safeguards monitoring.
严重空间天气事件对核电和保障监督的恢复力的可能性和影响。
- 批准号:
2908918 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Proton, alpha and gamma irradiation assisted stress corrosion cracking: understanding the fuel-stainless steel interface
质子、α 和 γ 辐照辅助应力腐蚀开裂:了解燃料-不锈钢界面
- 批准号:
2908693 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Field Assisted Sintering of Nuclear Fuel Simulants
核燃料模拟物的现场辅助烧结
- 批准号:
2908917 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Assessment of new fatigue capable titanium alloys for aerospace applications
评估用于航空航天应用的新型抗疲劳钛合金
- 批准号:
2879438 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Developing a 3D printed skin model using a Dextran - Collagen hydrogel to analyse the cellular and epigenetic effects of interleukin-17 inhibitors in
使用右旋糖酐-胶原蛋白水凝胶开发 3D 打印皮肤模型,以分析白细胞介素 17 抑制剂的细胞和表观遗传效应
- 批准号:
2890513 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
Understanding the interplay between the gut microbiome, behavior and urbanisation in wild birds
了解野生鸟类肠道微生物组、行为和城市化之间的相互作用
- 批准号:
2876993 - 财政年份:2027
- 资助金额:
-- - 项目类别:
Studentship
相似国自然基金
基于Genome mining技术研究抑制表皮葡萄球菌生物膜形成的次级代谢产物
- 批准号:21242003
- 批准年份:2012
- 资助金额:10.0 万元
- 项目类别:专项基金项目
原生MML矿业数据仓库关键技术研究
- 批准号:50604012
- 批准年份:2006
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
矿业数据仓库集成关键技术研究
- 批准号:50474033
- 批准年份:2004
- 资助金额:8.0 万元
- 项目类别:面上项目
矿业信息系统基于组件/ 构架的软件复用技术理论的研究
- 批准号:50074031
- 批准年份:2000
- 资助金额:23.0 万元
- 项目类别:面上项目
面向对象的可视化模拟技术及其在矿业中的应用
- 批准号:79870059
- 批准年份:1998
- 资助金额:9.0 万元
- 项目类别:面上项目
相似海外基金
Development of social attention indicators of emerging technologies and science policies with network analysis and text mining
利用网络分析和文本挖掘开发新兴技术和科学政策的社会关注指标
- 批准号:
24K16438 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
Technologies for High-Throughput Mapping of Antigen Specificity to B-Cell-Receptor Sequence
B 细胞受体序列抗原特异性高通量作图技术
- 批准号:
10734412 - 财政年份:2023
- 资助金额:
-- - 项目类别:
BRAIN CONNECTS: Center for a pipeline of high throughput integrated volumetric electron microscopy for whole mouse brain connectomics
大脑连接:用于全小鼠大脑连接组学的高通量集成体积电子显微镜管道中心
- 批准号:
10665386 - 财政年份:2023
- 资助金额:
-- - 项目类别:
New Graph Mining Technologies to Enable Timely Exploration of Social Events
新的图挖掘技术能够及时探索社交事件
- 批准号:
DP230100899 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Discovery Projects
Towards an integrated, self-learning stochastic mining complex framework and new digital technologies for the sustainable development of mineral resources
为矿产资源的可持续发展建立一个集成的、自学习的随机采矿复杂框架和新的数字技术
- 批准号:
RGPIN-2021-02777 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual