確率的生成モデルにおけるノンパラメトリックベイズ学習と自然言語処理への応用

随机生成模型中的非参数贝叶斯学习及其在自然语言处理中的应用

基本信息

  • 批准号:
    08J07036
  • 负责人:
  • 金额:
    $ 1.15万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2008
  • 资助国家:
    日本
  • 起止时间:
    2008 至 2011
  • 项目状态:
    已结题

项目摘要

本年度は主に3つの成果を上げることができた.これらの成果は,論文誌(1),国際会議(2)において発表を行った.1.離散的な隠れ状態をもつ文書の確率的生成モデルにおいて、単語の出現分布がPower-lawの性質をもつモデルを提案した提案モデルは、Power-lawの性質が内在するデータにおいては,既存モデルであるLatent Dirichlet Allocation (LDa)よりも未知のデータに対する予測性能が大幅に高いことが実験的に示すことができた.2.LDAにおける高速な決定論的逐次学習手法を提案した.本手法は,決定論的なオンライン学習アルゴリズムで,1度処理したデータは捨ててしまうので過去のデータを保持する必要がない.また,収束も早く,並列実行する必要もない手法である.3.Succinct Data structureを利用した圧縮半構造データマイニングアルゴリズムを提案した.XMLを中心として近年,木構造型の半構造データが大量に増加している.このようなデータに対してFREQTと呼ばれる高速に頻出するパターンを抽出するアルゴリズムが提案されている.本研究では,木構造データを情報論的下限まで圧縮した状態で,FREQTアルゴリズムを適用することが可能なアルゴリズムを提案した.
今年,我们取得了三个主要成果,这些成果在期刊(1)和国际会议(2)上发表。 1. 具有离散隐藏状态的文档的随机生成 在模型中,词出现分布具有幂律。属性。所提出的模型不同于具有幂律属性的数据中的现有模型潜在狄利克雷分配。我们能够通过实验证明,对于未知数据的预测性能明显高于(LDa)2。我们提出了一种快速确定性顺序学习方法,通过在线学习算法,已经处理过的数据被丢弃,因此不需要保留过去的数据。它收敛速度也很快,不需要并行执行。3.我们提出了一种利用结构的压缩半结构化数据挖掘算法。近年来,大量的树结构半结构化数据(主要是XML)不断增加。对于此类数据,一种称为FREQT的模式高速频繁出现。提出了一种提取FREQT算法的算法。在本研究中,我们提出了一种可以将FREQT算法应用于压缩到信息论下限的树结构数据的算法。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Knowledge Discovery of Semantic Relationships between Words Using Nonparametric Bayesian Graph Model
利用非参数贝叶斯图模型进行词间语义关系的知识发现
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nakano;T.;Marshall;B. A.;Kennedy;M.;Spencer;H. G.;佐藤一誠
  • 通讯作者:
    佐藤一誠
Topic models with power-law using Pitman-Yor process
Succinct Semi-structured Data Mining Based on FREQT
基于FREQT的简洁半结构化数据挖掘
Deterministic Single-Pass Algorithm for LDA
  • DOI:
  • 发表时间:
    2010-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Issei Sato;Kenichi Kurihara;Hiroshi Nakagawa
  • 通讯作者:
    Issei Sato;Kenichi Kurihara;Hiroshi Nakagawa
Quantum Annealing for Variational Bayes Inference
  • DOI:
  • 发表时间:
    2009-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Issei Sato;Kenichi Kurihara;Shu Tanaka;Hiroshi Nakagawa;S. Miyashita
  • 通讯作者:
    Issei Sato;Kenichi Kurihara;Shu Tanaka;Hiroshi Nakagawa;S. Miyashita
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

佐藤 一誠其他文献

骨髄異形成症候群の形態学的分類におけるばらつきと標準化の必要性
骨髓增生异常综合征形态学分类的变异性和标准化的必要性
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山本 紀子;笹田 景子;舛田 博貴;石原 綾子;田中 洋子;高松 泰;矢冨 裕;勝田 和一郎;佐藤 一誠;松井 啓隆
  • 通讯作者:
    松井 啓隆
機械学習のための連続最適化
机器学习的持续优化
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金森 敬文;鈴木 大慈;竹内 一郎;佐藤 一誠
  • 通讯作者:
    佐藤 一誠
RoboCup: a grand challenge toward 2050
RoboCup:迈向2050年的伟大挑战
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    神嶌 敏弘;赤穂 昭太郎;佐藤 一誠;R. Fam and Y. Lepage;Itsuki Noda
  • 通讯作者:
    Itsuki Noda
係り受け関係を考慮したテキストマイニングのための半構造マイニング手法の提案
考虑依赖关系的文本挖掘半结构化挖掘方法的提出
Latent Dirichlet Allocation における決定論的オンラインベイズ学習
潜在狄利克雷分配中的确定性在线贝叶斯学习
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 一誠;中川裕志
  • 通讯作者:
    中川裕志

佐藤 一誠的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('佐藤 一誠', 18)}}的其他基金

機械学習における予測の不確実性の定量化基盤の構築
为量化机器学习中的预测不确定性奠定基础
  • 批准号:
    23K20385
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
深層学習における認知的ヒューリスティックスの構成的理解
对深度学习中认知启发法的建设性理解
  • 批准号:
    24H00709
  • 财政年份:
    2024
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Constructing mathematical foundation in interdisciplinary field of optics and machine learning
构建光学与机器学习跨学科领域的数学基础
  • 批准号:
    22K19787
  • 财政年份:
    2022
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Quantifying Prediction Uncertainty in Machine Learning
量化机器学习中的预测不确定性
  • 批准号:
    20H04239
  • 财政年份:
    2020
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

筋電位信号に対するもつれ解き表現学習法の提案とロバストな操作インタフェースの実現
肌电位信号解缠表示学习方法的提出及鲁棒操作接口的实现
  • 批准号:
    23H03438
  • 财政年份:
    2023
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Foundation of Co-creative Learning based on Symbol Emergence Systems Theory
基于符号涌现系统理论的共创学习基础
  • 批准号:
    21H04904
  • 财政年份:
    2021
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Active Decision Making for Efficient Learning of Spatial Concepts by Autonomous Mobile Robots
自主移动机器人有效学习空间概念的主动决策
  • 批准号:
    20K19900
  • 财政年份:
    2020
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Unification of Deep Learning and Generalized Mathematical Model for Independence-Based Audio Source Separation
深度学习与广义数学模型的统一用于基于独立的音频源分离
  • 批准号:
    19K20306
  • 财政年份:
    2019
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Audio-Visual Music Understanding Based on Integration of Recognition and Generative Processes
基于识别和生成过程整合的视听音乐理解
  • 批准号:
    19H04137
  • 财政年份:
    2019
  • 资助金额:
    $ 1.15万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了