Dimension and variable selection, simultaneous estimation, and computational environment for information extraction from complex data
从复杂数据中提取信息的维度和变量选择、同时估计和计算环境
基本信息
- 批准号:21K11799
- 负责人:
- 金额:$ 2.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、マーケティングや社会心理学の分野を想定し、(i)情報損失を最小限に抑えた大規模さの軽減、(ii)縮約した情報や複雑性の関係の効率的な把握、(iii)尺度混在データの処理とテキストデータの処理を含む分析手順の提供、(iv)対話的なインタフェースの提供、(v)計算の効率化を順に実現していくことを目的としており、本年度は、それぞれについて取り組んだ。(i)~(iii)については、昨年度に引き続き、テストや調査問題において無駄な項目を削除することで複雑さを軽減することに取り組んだ。特に、尺度混在データに焦点をあて、カテゴリカルデータを項目反応理論や非計量主成分分析で数量化して、カテゴリカルデータを量的に扱える手法を提案するとともに、項目反応理論で導かれる潜在特性値による変数の削減手順の開発と拡張主成分分析をカテゴリカルデータに応用する非計量拡張主成分分析の性能評価を行った。いずれも提案手法を実データに利用する場合の一般手順を示すことができた。また、(iii)の後半のテキストデータについては、テキストマイニングの結果から得られる情報をさらに分析する方法の可能性を検討した。(iv)については、R上で動く環境の1つであるShinyを利用して、対話的インタフェースの構築を試みた。(v)については、vectorε法による計算の加速化の効果をより精密に評価するため、ファジーc平均法での数値実験を行い、パラメータ(=データの様相)の違いによる加速化の性質を明らかにした。これらの成果については、日本計算機統計学会のシンポジウム、国際計算機統計協会のアジア地区の大会などで発表した。また、9月に、シンガポールとドイツの研究者を招き、大規模・複雑化データの扱いに関する研究集会を岡山と京都で開き、計算方法や効率化について議論した。
本研究假设市场营销和社会心理学领域,旨在(i)通过最小化信息损失来缩小规模,(ii)有效掌握减少的信息与复杂性之间的关系,以及(iii)提供分析程序,包括处理混合尺度数据和文本数据,(iv) 提供交互界面,(v) 提高各自的计算效率。关于(i)至(iii),我们从去年开始,通过删除不必要的项目来降低测试和调查问题的复杂性。特别是,我们专注于混合尺度数据,使用项目响应理论和非度量主成分分析来量化分类数据,并提出一种定量处理分类数据的方法,以及从项目响应理论导出的潜在特征我们开发了一个程序。用于按值减少变量并评估非度量扩展主成分分析的性能,该分析将扩展主成分分析应用于分类数据。在这两种情况下,我们都能够演示将所提出的方法应用于实际数据的一般程序。关于(iii)后半部分的文本数据,我们研究了进一步分析从文本挖掘结果中获得的信息的可能性。关于(iv),我们尝试使用Shiny(一个在R上运行的环境)构建一个交互界面。关于(v),为了更精确地评估使用向量ε方法的加速计算的效果,我们使用模糊c均值方法进行了数值实验,并阐明了由于参数(=数据方面)的差异而导致的加速的性质。我做到了。这些结果在日本计算统计学会的研讨会和国际计算统计协会的亚洲区域会议上公布。此外,9月份,新加坡和德国的研究人员受邀在冈山和京都召开了处理大规模复杂数据的研究会议,讨论了计算方法和效率。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
質的データの項目精選-項目反応理論を利用した項目選択の検討-
定性数据的项目选择 - 使用项目响应理论检查项目选择 -
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:片山浩子;森 裕一
- 通讯作者:森 裕一
Speeding up the convergence of the alternating least squares algorithm using vector ε acceleration and restarting for nonlinear principal component analysis
使用矢量 ε 加速和重启来加速交替最小二乘算法的收敛以进行非线性主成分分析
- DOI:10.1007/s00180-022-01225-4
- 发表时间:2022
- 期刊:
- 影响因子:1.3
- 作者:Kuroda; M.; Mori; Y.; IIzuka; M.
- 通讯作者:M.
Variable Selection in Nonlinear Principal Component Analysis
非线性主成分分析中的变量选择
- DOI:10.5772/intechopen.103758
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Katayama; H.; Mori; Y.; Kuroda; M.
- 通讯作者:M.
Acceleration of Computation in Fuzzy Clustering
模糊聚类中的计算加速
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Mori;Y.; Akaki;T.; Kuroda; M.
- 通讯作者:M.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
森 裕一其他文献
統計教育におけるデータ収集・登録機能の活用-モバイル統計解析システム構築の試み-
数据采集与登记功能在统计教育中的运用——尝试构建移动统计分析系统——
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
森 裕一; 山本義郎; 宿久 洋 - 通讯作者:
宿久 洋
データ指向統計環境 DoSS@d における データ収集・登録機能
面向数据的统计环境DoSS@d中的数据收集和登记功能
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
森 裕一; 山本義郎; 宿久 洋 - 通讯作者:
宿久 洋
リスタートを用いた加速化交互最小二乗法による非計量主成分分析の変数選択法について
使用重启加速交替最小二乘法进行非度量主成分分析的变量选择方法
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
黒田正博;森 裕一;飯塚誠也 - 通讯作者:
飯塚誠也
統計教育におけるデータ収集・登録機能の活用-モバイル統計解析システム構築の試み-
数据采集与登记功能在统计教育中的运用——尝试构建移动统计分析系统——
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
森 裕一; 山本義郎; 宿久 洋 - 通讯作者:
宿久 洋
森 裕一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('森 裕一', 18)}}的其他基金
光学材料応用を目指したハイパーブランチポリマーの合成に関する研究
光学材料应用超支化聚合物的合成研究
- 批准号:
09J56511 - 财政年份:2009
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
数・図形領域におけるマルチメディア教材とコンサルテーションシステムの開発-学習障害児を対象として-
开发数学、图形领域的多媒体教材和咨询系统——针对学习障碍儿童——
- 批准号:
07780166 - 财政年份:1995
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
マルチメディアによる保育科短大の情報処理教育(エキスパートシステムを利用して)
利用多媒体进行幼儿园大专信息处理教育(利用专家系统)
- 批准号:
03780265 - 财政年份:1991
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
カテゴリ変数を伴う臨床研究における新たな解析法およびデザインの開発
开发涉及分类变量的临床研究的新分析方法和设计
- 批准号:
21K11790 - 财政年份:2021
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Research on Categorical Data Analysis Method based on Geometric interpretation of Data
基于数据几何解释的分类数据分析方法研究
- 批准号:
20K02162 - 财政年份:2020
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A study on asymptotic analysis for robust quasi-posterior distributions
稳健拟后验分布的渐近分析研究
- 批准号:
19K14597 - 财政年份:2019
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Development of exact tests where the primary endpoint is a categorical variable
开发主要终点为分类变量的精确测试
- 批准号:
18K11195 - 财政年份:2018
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Establishing Statistical Precision Evaluation Methodology of Measurement Methods for Qualitative Data
建立定性数据测量方法的统计精度评价方法
- 批准号:
15K01207 - 财政年份:2015
- 资助金额:
$ 2.58万 - 项目类别:
Grant-in-Aid for Scientific Research (C)