当机器智能遇到人类计算─基于众包的分类数据挖掘技术研究
项目介绍
AI项目解读
基本信息
- 批准号:71301071
- 项目类别:青年科学基金项目
- 资助金额:23.0万
- 负责人:
- 依托单位:
- 学科分类:G0112.信息系统与管理
- 结题年份:2016
- 批准年份:2013
- 项目状态:已结题
- 起止时间:2014-01-01 至2016-12-31
- 项目参与者:李捷迅; Sang-Pil Han; 张瑾玉; 何铁科; 魏吉勇; 雷鸣;
- 关键词:
项目摘要
Since most of big data is raw data, the commercial value in it cannot be utilized. The biggest obstacle to use classification technique in mining big data is: the lack of labeling data as training samples. The new human computation, crowdsourcing, can label data with very low cost and high-efficiency. This research project will explore the related theory and technical challenges when using crowdsourcing labeling data in classification, in order to mine big data with low-cost and high-efficiency. This project will study the classification model of integrating crowdsourcing, to utilize the inaccurate and redundant training samples from crowdsourcing, to achieve good performance; also the active learning method of integrating crowdsourcing will be studied, to efficiently select samples, labelers and labeling strategies, to achieve good performance. This study will enrich the theories of classification model and the active learning, and is expected to open up a new direction of active learning.
由于很多大数据是未经分类和标注的原始数据,其蕴含的丰富商业价值很难被利用。而阻碍分类挖掘技术对大数据进行分类挖掘的最大障碍是:极度缺少标注训练样本。而新的人类计算方式─众包,能进行低成本、高效率的数据标注。本课题主要探讨有效利用众包标注的数据进行分类挖掘,所要解决的理论与技术挑战,以便对大数据进行低成本、高时效的分类挖掘。本课题将研究集成众包的分类模型,来利用众包标注的不准确和冗余的训练样本,获得较好的分类性能;同时还研究集成众包的主动学习方法,来高效选择样本、标注者、标注策略,从而更有效的利用众包实现更好的分类挖掘。本研究期望丰富数据挖掘的分类模型理论和主动学习理论,并有望开拓主动学习的新方向。
结项摘要
本项目的研究背景:在大数据时代,每天产生海量的数据,其中很多大数据是未经分类和标注的原始数据,其蕴含的丰富商业价值很难被利用。而阻碍分类挖掘技术对大数据进行商业价值挖掘的最大障碍是:极度缺少标注训练样本。而新涌现的人类计算方式─众包,能进行低成本、高效率的数据标注。.本课题主要研究内容:探讨有效利用众包标注的数据进行分类挖掘,所要解决的理论与技术挑战,以便对大数据进行低成本、高时效的分类挖掘。本课题将研究集成众包的分类模型,研究集成众包的主动学习方法,来高效选择样本、标注者、标注策略,从而更有效的利用众包实现更好的分类挖掘。.本课题重要结果包括:人才培养方面,主持人获得自科“优青”资助。论文发表方面,发表SSCI/SCI论文3篇,其中2篇为国际顶级期刊(UT Dallas期刊,主持人为一作)。提出的基于主动学习的Large-Margin Classifiers方法,只要利用较少的标注样本,就能较准确的对社交媒体的文本数据进行语义标注,便于发现数据中深层的价值。此研究采用独特的视角,将主动学习看作是最优参数的搜索过程,提出了提升数据分析性能的有效策略. 实验评估表明,本研究提出的方法利用少量标注数据(降低19.74%的标注成本),就能达到较好的性能。这为利用众包进行大数据分析提供了模型和方法基础。并丰富了数据挖掘的分类模型理论和主动学习理论。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Battle of the Channels: The Impact of Tablets on Digital Commerce
渠道之战:平板电脑对数字商务的影响
- DOI:--
- 发表时间:--
- 期刊:Management Science
- 影响因子:5.4
- 作者:Kaiquan Xu;J. Chan;A. Ghose;S. Han
- 通讯作者:S. Han
Sentiment community detection: exploring sentiments and relationships in social networks
情感社区检测:探索社交网络中的情感和关系
- DOI:10.1007/s10660-016-9233-8
- 发表时间:2017
- 期刊:Electronic Commerce Research
- 影响因子:3.9
- 作者:Dong Wang;Jiexun Li;Kaiquan Xu;Yizhen Wu
- 通讯作者:Yizhen Wu
Effective Active Learning Strategies for the Use of Large-Margin Classifiers in Semantic Annotation: An Optimal Parameter Discovery Perspective
在语义注释中使用大裕度分类器的有效主动学习策略:最佳参数发现视角
- DOI:10.1287/ijoc.2013.0578
- 发表时间:2014
- 期刊:INFORMS Journal on Computing
- 影响因子:2.1
- 作者:Kaiquan Xu;S.S. Liao;R.Y. K. Lau;J. Leon Zhao
- 通讯作者:J. Leon Zhao
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
内容获取失败,请点击重试
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图
请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}