習熟度推定モデルに基づくデジタル人材育成支援システムの開発
基于能力评价模型的数字化人力资源开发支撑系统开发
基本信息
- 批准号:22K12309
- 负责人:
- 金额:$ 2.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本研究課題は、組織に特化したデータを学習データとした機械学習によるテキストマイニングを行い、特徴量を抽出し情報リテラシーに関する学習の習熟度を推定するモデルを開発することである。本研究課題の特徴として、組織に特化したデータとして、レポートや試験等の直接的なデータではなく、問い合わせ対応のデータ等の間接かつ時系列データから習熟度を推定することである。ここで問題となるのが一般的な機械学習の学習データと比べて組織に特化したデータは、データ量が少ない傾向にある。そのため開発したモデルの精度を高めるためには、学習データのクリーニングを適切に行い習熟度を推定するモデルからノイズを除去する必要があると考えられる。本研究課題では、メールでの問い合わせデータを主な学習データとすることから挨拶文や署名、引用返信等の情報は、情報リテラシーに関する学習の習熟度推定に直接的に影響しないデータノイズである。またメールデータは、文書の構造が問い合わせフォーム等と異なり質問者に依存しているため簡単にデータノイズをプログラムよる自動処理でクリーニングすることが難しい。2022年度は、習熟度推定のモデル開発を行うためにデータノイズを除去した学習データを生成する機械学習を用いたクリーニングモデルを開発した。一般に機械学習で使われている学習データでは、メールデータ内の要・不要データを分類することができないため、本モデルに最適化した学習データを作成した。作成した学習データを使ってクリーニングモデルを作成し、情報リテラシー学習の習熟度推定モデル作成のためのデータセットをデータノイズの定義方法の違いにより複数作成した。情報リテラシー習熟度推定モデルを開発する前に、これらのデータセットを使って習熟度推定モデルのモデル空間について評価が必要となる。
本研究的目的是使用组织特定数据作为学习数据,使用机器学习进行文本挖掘,提取特征,并开发一个模型来估计有关信息素养的学习熟练程度。该研究项目的一个特点是,熟练程度是根据查询响应数据等间接数据和时间序列数据来估计的,而不是报告和考试等直接数据(组织特定的数据)。这里的问题是,与一般机器学习的学习数据相比,特定于组织的数据量往往较小。因此,为了提高所开发模型的准确性,有必要适当地清理学习数据并从估计熟练程度的模型中去除噪声。本研究项目中,电子邮件查询数据是主要的学习数据,因此问候语、签名、引用回复等信息属于数据噪声,不会直接影响信息素养学习能力的评估。此外,与询问表格等不同,电子邮件数据具有取决于提问者的文档结构,因此难以通过使用程序的自动处理来容易地清除数据噪声。在 2022 财年,我们开发了一种使用机器学习的清洁模型,该模型可生成消除数据噪声的学习数据,以便开发熟练度评估模型。由于机器学习中常用的训练数据无法对电子邮件数据中必要和不必要的数据进行分类,因此我们创建了针对该模型优化的训练数据。使用创建的训练数据创建清理模型,并创建多个数据集,以使用不同的数据噪声定义方法创建信息素养学习的熟练度估计模型。在开发信息素养能力评估模型之前,有必要使用这些数据集评估能力评估模型的模型空间。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
山本 一幸其他文献
山本 一幸的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
テキストマイニングを用いたレビュー分析にみる観光地へのニーズと影響要因
基于文本挖掘的评论分析中的旅游目的地需求及影响因素
- 批准号:
24K15556 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
テキストマイニングを活用した中国語会話学習プラットフォームの開発
基于文本挖掘的汉语会话学习平台的开发
- 批准号:
24K04084 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
帝国議会議事速記録のコーパス化とテキストマイニングによる近代日本語史の解明
通过帝国国会会议记录的语料库记录和文本挖掘阐明现代日本的历史
- 批准号:
23K25329 - 财政年份:2024
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
選挙期間中に候補者が発信するソーシャルメディアのコンテンツ分析
选举期间候选人发布的社交媒体内容分析
- 批准号:
23K11766 - 财政年份:2023
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Methodological Innovation in the Study of the History of Thought by the Metrical Analysis of Texts : The Case of Max Weber and German Social Sciences
文本格律分析思想史研究的方法论创新:以马克斯·韦伯与德国社会科学为例
- 批准号:
23K00090 - 财政年份:2023
- 资助金额:
$ 2.66万 - 项目类别:
Grant-in-Aid for Scientific Research (C)