文字の分類とパターン探索アルゴリズムの研究

字符分类与模式搜索算法研究

基本信息

  • 批准号:
    13780271
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2001
  • 资助国家:
    日本
  • 起止时间:
    2001 至 2002
  • 项目状态:
    已结题

项目摘要

本年度はパターン探索の対象となるパターンのクラスを、昨年度まで主に用いていた単純な部分文字列クラスや、代入・削除・挿入を許した近似文字列パターンから拡張を試みた。具体的には任意の文字列とマッチする事が可能な「ワイルドカード文字」を含むVLDC (variable length don't care) パターンと呼ばれるパターンのクラスについて新たに考察し、VLDCパターンの問合せを高速に処理する事が可能なMASDAWGと呼ばれる文字列の索引構造を開発した。更にこの索引構造を用いて効率的にVLDCパターンの探索を行なうアルゴリズムに関して研究・開発を行なった。このようにパターンの記述力を高める事で、パターン探索に際してより有用な知識を得られる事が期待される。これを検証するために、データとして正例と負例の文字列集合が与えられた時に、正例のみ、もしくは負例のみに、最も特異的に現われるVLDCパターンを探索するアルゴリズムを開発し、実データに対して適用した。開発したアルゴリズムを昨年度に解析したN-末端細胞内局在化シグナルを持つアミノ酸配列データに対して適用したところ、分類精度の向上と、発見されたパターンが局在化シグナルに関して既知の特徴を良く捉えている事が確認できた。他には遺伝子のDNA配列における長大なイントロンの配列の解析を行ない、長いイントロンに特徴的なVLDCパターンを発見する事に成功した。プログラムの開発はObjective Camlと呼ばれる関数型言語で行ない、ソースコードは一部GPLで公開している(http://biocaml.org/)。
今年,我们尝试将模式搜索的目标模式类从去年主要使用的简单子字符串类扩展到允许赋值、删除和插入的近似字符串模式。具体来说,我们新考虑了一类称为 VLDC(可变长度无关)模式的模式,其中包含可以匹配任意字符串的“通配符”,并使 VLDC 模式的查询速度更快。我们开发了一种称为 MASDAWG 的字符串索引结构。可以进行处理。此外,我们还研究和开发了一种使用该索引结构有效搜索 VLDC 模式的算法。通过以这种方式提高描述模式的能力,期望在搜索模式时可以获得更多有用的知识。为了验证这一点,当给定一组正例和反例的字符串作为数据时,我们开发了一种算法,用于搜索最具体地只出现在正例中或仅出现在反例中的VLDC模式,并实现它。应用于数据。当我们将开发的算法应用于去年分析的具有 N 端细胞内定位信号的氨基酸序列数据时,我们发现分类精度提高了,并且发现的模式更好地匹配了定位信号的已知特征。它被捕获了。此外,我们分析了基因DNA序列中的长内含子序列,并成功发现了长内含子特征的VLDC模式。该程序使用名为 Objective Caml 的函数式语言开发,部分源代码在 GPL 下发布(http://biocaml.org/)。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
H.Bannai, et al.: "Concepts for Accelerating the Computational Knowledge Discovery Process"Linkoping Electronic Articles in Computer and Information Science. 6. (2001)
H.Bannai 等人:“加速计算知识发现过程的概念”林雪平计算机和信息科学电子文章。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Ott et al.: "Intrasplicing-Analysis of Long Intron Sequences"Proc. Pacific Symposium on Biocomputing. 8. 339-350 (2003)
S.Ott 等人:“长内含子序列的内剪接分析”Proc。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

坂内 英夫其他文献

Serpentine minerals from Irikura, Oita Prefecture, Japan
产自日本大分县入仓的蛇纹石矿物
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸;加藤隆文;長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅;延寿 里美
  • 通讯作者:
    延寿 里美
日向沖南海トラフ前弧域の浅部活構造
日向附近南海海槽弧前区的浅层活动构造
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸;加藤隆文;長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅;延寿 里美;加藤隆文;加藤隆文;山口飛鳥・新井和乃・池原研・金松敏也・福地里菜・中村恭之・宇佐美和子・奥津なつみ・清家弘治・芦寿一郎;加藤隆文;山口飛鳥・福地里菜・濱橋真理・清水真由子・江口大賀・金川久一;Takafumi Kato;加藤隆文;芦寿一郎・山口飛鳥・福地里菜・大出晃弘・奥津なつみ・田淵優・池原研
  • 通讯作者:
    芦寿一郎・山口飛鳥・福地里菜・大出晃弘・奥津なつみ・田淵優・池原研
習慣的意味仮設説による概念プラグマティズム擁護の試み
基于习惯意义假设来捍卫概念实用主义的尝试
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸;加藤隆文;長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅;延寿 里美;加藤隆文;加藤隆文;山口飛鳥・新井和乃・池原研・金松敏也・福地里菜・中村恭之・宇佐美和子・奥津なつみ・清家弘治・芦寿一郎;加藤隆文;山口飛鳥・福地里菜・濱橋真理・清水真由子・江口大賀・金川久一;Takafumi Kato;加藤隆文
  • 通讯作者:
    加藤隆文
Minimum Suffix Array の逆問題
最小后缀数组的逆问题
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸
  • 通讯作者:
    竹田 正幸
延岡衝上断層ボーリングコア中の断層帯の化学組成分布
延冈逆冲断层钻孔核心断层带化学成分分布
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中島 祐人;稲永 俊介;坂内 英夫;竹田 正幸;加藤隆文;長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅
  • 通讯作者:
    長谷川亮太・山口飛鳥・福地里菜・石川剛志・北村有迅

坂内 英夫的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('坂内 英夫', 18)}}的其他基金

辞書式圧縮と圧縮情報処理の深化
字典压缩与压缩信息处理的深化
  • 批准号:
    24K02899
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
文字列の辞書式順序の組合せ論とその応用
字符串字典顺序组合学及其应用
  • 批准号:
    20H04141
  • 财政年份:
    2020
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
最適複合文字列パターン発見アルゴリズムに関する研究
最优复合串模式发现算法研究
  • 批准号:
    18700153
  • 财政年份:
    2006
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
文字列属性を含む多属性データからのパターン発見アルゴリズムに関する研究
字符串属性等多属性数据的模式发现算法研究
  • 批准号:
    15700121
  • 财政年份:
    2003
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似国自然基金

基于指数迭代增长和"异氰酸酯-胺"点击反应的手性聚氨基酸衍生物的精准合成及性能研究
  • 批准号:
    91856113
  • 批准年份:
    2018
  • 资助金额:
    75.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Role of SIK3 in PKA/mTORC1 regulation of adipose browning
SIK3 在 PKA/mTORC1 调节脂肪褐变中的作用
  • 批准号:
    10736962
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
Characterizing metabolic variability during pregnancy to understand pathways of in-utero overnutrition: an integrative analysis of metabolomics and lifestyle data
表征妊娠期间的代谢变异性以了解子宫内营养过剩的途径:代谢组学和生活方式数据的综合分析
  • 批准号:
    10913646
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
Leucine as a Probe of Kynurenine-Induced Glutamate and Neural Circuit Dysfunction in Midlife Depression
亮氨酸作为犬尿氨酸诱导的谷氨酸和中年抑郁症神经回路功能障碍的探针
  • 批准号:
    10753154
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
Minimally-invasive technology for personalized nutritional monitoring
用于个性化营养监测的微创技术
  • 批准号:
    10693521
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
Mitochondrial Dysfunction underlies treatment related hepatotoxicity in Hispanics with acute lymphoblastic leukemia
线粒体功能障碍是西班牙裔急性淋巴细胞白血病治疗相关肝毒性的基础
  • 批准号:
    10675403
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了