Applying High-Performance Data Compression Method to Data Science: Application to Data with Dependence

将高性能数据压缩方法应用于数据科学:应用于具有依赖性的数据

基本信息

  • 批准号:
    22K14254
  • 负责人:
  • 金额:
    $ 1.33万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究では、依存関係のあるデータ系列に対する分類問題、予測問題等に対して、高性能データ圧縮法のひとつであるベイズ符号の理論研究成果と効率的データ圧縮アルゴリズムを応用することにより、分類誤り率や予測の2乗誤差などの数式に対する数学的に正確な理論解析を行うとともに、ベイズ決定理論に基づく理論最適性を保ちつつ効率的なアルゴリズムを構築することが目標である。この目標に対して、今年度は以下の成果を得た。1)ベイズ符号は、ベイズリスクを最小にするような符号化確率を用いてデータを圧縮する。このベイズリスクの下界に関して従来さまざまな理論評価が行われていた。本研究では、「meta-bound」という不等式から、従来のさまざまなベイズリスクの下界が導かれることを示し、情報理論のトップカンファレンスであるIEEE International Symposium on Information Theory(ヘルシンキ、フィンランド)にて発表した。2)依存関係のあるデータの一例として文脈木情報源から発生するデータがある。この文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界を、ベイズ符号の理論研究を応用することで導出した。研究結果は電子情報通信学会 情報理論研究会(群馬県前橋市)にて発表した。3)文脈木情報源から発生したデータの分類問題の分類誤り率を、ベイズ符号の理論研究を応用することで導いた。研究結果は電子情報通信学会 情報理論研究会(岐阜県岐阜市)にて発表した。
在这项研究中,将分类和有效的数据压缩算法(是高性能数据压缩方法之一)以及有效的数据压缩算法应用于分类问题,预测问题等。数学准确的理论分析(例如比率和预测),并构建有效的算法,同时基于贝叶斯决策理论来维持理论。为了回应这一目标,今年取得了以下结果。 1)贝叶斯代码使用代码连接概率压缩数据,该概率将Bayz风险降至最低。过去,对贝叶斯风险的下部世界进行了各种理论评估。在这项研究中,不平等的“元限制”表明,各种海湾风险的下层世界由IEEEE IEEE IEEE国际研讨会(IEEEE IEEE IEEE INTERNATE)主持,这是信息理论的顶级会议。 2)有从上下文树信息源生成的数据,作为依赖关系的示例。通过应用贝叶斯代码理论研究,得出了序列 - 类型信息源类别最大冗余的下层世界。研究结果是在信息理论协会(Maebashi City,Gunma县)的电子信息与通信协会宣布的。 3)通过应用贝叶斯法规的理论研究引导的上下文树信息源产生的数据的分类。研究结果是在电子信息理论协会(GIFU City,GIFU县)的电子信息与通信协会宣布的。

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
文脈木情報源に対する逐次型情報源符号化の最大冗長度の下界について
上下文树信息源顺序信息源编码最大冗余下界
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    本田 健斗;松倉 悠;岩井 大輔;石田 寛;佐藤 宏介;齋藤翔太
  • 通讯作者:
    齋藤翔太
ベイズ決定理論に基づく機械学習ライブラリ:BayesML 0.1.0
基于贝叶斯决策理论的机器学习库:BayesML 0.1.0
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中原 悠太;一條 尚希;島田 航志;飯窪 祐二;齋藤 翔太;風間 皐希;松嶋 敏泰;BayesML Code Authors
  • 通讯作者:
    BayesML Code Authors
On Bayesian Approach for Classification of Context Tree Model
上下文树模型分类的贝叶斯方法
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中原悠太;齋藤翔太;島田航志;飯窪祐二;風間皐希;一條尚希;松嶋敏泰;BayesML Developers;Shota Saito
  • 通讯作者:
    Shota Saito
On Meta-Bound for Lower Bounds of Bayes Risk
关于贝叶斯风险下界的元界
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shota Saito
  • 通讯作者:
    Shota Saito
Lower Bound of Bayes Risk in Parameter Estimation under Local Differential Privacy
局部差分隐私下参数估计的贝叶斯风险下界
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    阿部 晃大;日高敦仁;齋藤翔太;Shota Saito
  • 通讯作者:
    Shota Saito
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

齋藤 翔太其他文献

ヘリコバクター・ピロリ抗体検査と血清ペプシノゲン検査による 胃がんリスク層別化検診の医療経済効果の推定
使用幽门螺杆菌抗体检测和血清胃蛋白酶原检测评估胃癌风险分层筛查的医疗经济效果
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    齋藤 翔太;石川 卓;赤澤 宏平
  • 通讯作者:
    赤澤 宏平
建築熱性能解析のためのBEST シミュレーション (第10 報)建物性能値と蓄熱負荷の相関解析
建筑热性能分析的BEST模拟(第十次报告)建筑性能值与蓄热负荷的相关性分析
線形回帰モデルの混合の統一的なフレームワークにおけるベイズ最適な予測とその近似アルゴリズム
线性回归模型混合统一框架中的贝叶斯最优预测及其逼近算法
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村山 春香;齋藤 翔太;飯窪 祐二;中原 悠太;松嶋 敏泰
  • 通讯作者:
    松嶋 敏泰

齋藤 翔太的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Construction of Bayesian Optimal Decision Tree Algorithm Using Metatree and Latent Class Tree by Information Theory
基于信息论的元树和潜在类树构建贝叶斯最优决策树算法
  • 批准号:
    23K03863
  • 财政年份:
    2023
  • 资助金额:
    $ 1.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Fundamental research on finite length analysis in information theory and optimization theory for practical, reliable, and highly efficient communications
信息论有限长度分析和实用、可靠、高效通信的优化理论基础研究
  • 批准号:
    17K06446
  • 财政年份:
    2017
  • 资助金额:
    $ 1.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Creation of efficient simultaneous experiments for multiple objectives under Bayesian theory
在贝叶斯理论下创建高效的多目标同时实验
  • 批准号:
    17K00316
  • 财政年份:
    2017
  • 资助金额:
    $ 1.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Deeping Brain Decoding Technology and Development of its Application based on Understanding the Mechanism of Dealing with Multimodal Information in the Brain
基于理解大脑多模态信息处理机制的深层次脑解码技术及其应用开发
  • 批准号:
    17H01797
  • 财政年份:
    2017
  • 资助金额:
    $ 1.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Probability Distribution Approach to Image Dictionaries for Compressed Sensing
压缩感知图像字典的概率分布方法
  • 批准号:
    17K00340
  • 财政年份:
    2017
  • 资助金额:
    $ 1.33万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了