正当な電子メールの特徴を利用した言語の種類に依存しない迷惑メールフィルターの開発

开发利用合法电子邮件特征的独立于语言的垃圾邮件过滤器

基本信息

  • 批准号:
    21700078
  • 负责人:
  • 金额:
    $ 2.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009 至 2011
  • 项目状态:
    已结题

项目摘要

正当な電子メールの特徴に着目し、言語の種類に依存しない迷惑メールフィルターシステムを構築した。また、処理速度および分類精度の向上を図るため、電子メール受信モジュール、言語解析モジュール、機械学習モジュール、電子メール分類モジュールなどに分割したシステム設計を行った。特に、機械学習モジュールは別サーバ上での実行を想定して、データの自動入出力インターフェイスを実装した。これにより、比較的処理時間の長くかかる機械学習処理をクラスターPCなどの別サーバ上で処理することが可能となり、分類精度を低下させることなく処理時間の短縮が実現できた。また、分類精度のさらなる改善を目的に、学習に利用する電子メール情報(本文情報、メールヘッダ情報)の組み合わせを検討すると同時に、本プロジェクトで開発したものとは別のメールフィルタリングソフト(ベイジアンフィルタ)を併用して分類処理することで、より分類精度を高くできることを明らかにした。二つのフィルターシステムは、異なる指標でメール分類規則を導き出すため、今回の結果は、正規メールの回収率は高いが迷惑メールを多く混入してしまうベイジアンフィルタの短所を、本プロジェクトで開発したメールフィルターシステムが補完して、迷惑メールの混入を防ぐことが出来たことによる精度の向上と考えられた。さらに、分類判定のパラメーターを最適化することで、これまで約97%の分類正解率を、およそ99%に引き上げることができた。
为了关注合法电子邮件的特征,我们创建了一个不取决于语言类型的垃圾邮件过滤系统。此外,为了提高处理速度和分类精度,设计了一个系统,其中该系统被分为电子邮件接收模块,语言分析模块,机器学习模块,电子邮件分类模块等。特别是,机器学习模块已在单独的服务器上运行,已经实现了自动数据输入/输出接口。这使得可以处理在单独的服务器(例如群集PC)上需要相对较长处理时间的机器学习过程,并减少处理时间而不降低分类精度。此外,为了进一步提高分类准确性,我们已经检查了用于学习的电子邮件信息(主要文本信息,电子邮件标头信息)的组合,同时,我们透露,可以通过使用电子邮件过滤软件(贝叶斯过滤器)与该项目中开发的一个分开使用电子邮件过滤软件(贝叶斯过滤器)来提高分类精度。由于两个过滤器系统使用不同的指标得出了电子邮件分类规则,因此由于该项目中开发的电子邮件滤波器系统能够补充贝叶斯过滤器的缺点,因此该结果被认为是一种改进的准确性,对于常规电子邮件而言,贝叶斯过滤器的缺点率很高,但受到了很多垃圾邮件的污染,并且能够防止垃圾邮件包含垃圾邮件。此外,通过优化分类判断参数,分类的正确答案率约为97%,已提高到约99%。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
メーリングリストを対象とした機械学習によるスパムメールの分類
使用机器学习对邮件列表进行垃圾邮件分类
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之;山口博之;角朝香
  • 通讯作者:
    角朝香
ベイジアン方式と機械学習の併用によるスパムメールフィルタリング
使用贝叶斯方法和机器学习过滤垃圾邮件
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之;山口博之
  • 通讯作者:
    山口博之
機械学習によるメールヘッダ情報に基づく迷惑メールフィルタリング
使用机器学习基于电子邮件标头信息过滤垃圾邮件
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学
  • 通讯作者:
    杉井学
ベイジアン方式と機械学習を併用したスパムメールフィルタの検討
使用贝叶斯方法和机器学习的垃圾邮件过滤器的考虑
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之
  • 通讯作者:
    山口博之
機械学習を応用したスパムメールフィルタリング手法の検討と評価
应用机器学习的垃圾邮件过滤方法研究与评估
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    村中慎治;廣森聡仁;山口弘純;東野輝夫;杉井学;山口博之;山口博之;角朝香;角朝香
  • 通讯作者:
    角朝香
共 6 条
  • 1
  • 2
前往

杉井 学其他文献

言語分布地図を扱うGIS構築
处理语言分布图的 GIS 构建
  • DOI:
  • 发表时间:
    2006
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tokumaru;Aid;徳丸 亜木;徳丸亜木;古家信平;乾 秀行;乾 秀行;乾 秀行;柘植 洋一;柘植 洋一;Yoichi TSUGE;小脇 光男;Akio NAKANO;杉井 学;杉井 学
    Tokumaru;Aid;徳丸 亜木;徳丸亜木;古家信平;乾 秀行;乾 秀行;乾 秀行;柘植 洋一;柘植 洋一;Yoichi TSUGE;小脇 光男;Akio NAKANO;杉井 学;杉井 学
  • 通讯作者:
    杉井 学
    杉井 学
Synthetic Speech for Foreign Language Learning : A Viewpoint of Teachers
外语学习中的合成语音:教师的观点
マロ語の音素目録
马洛语音素清单
  • DOI:
  • 发表时间:
    2007
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    葉山アツコ;葉山アツコ;Hayama Atsuko;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;柘植洋一;乾秀行;乾秀行;小脇光男;柘植洋一;乾秀行;柘植洋一;乾 秀行;柘植 洋一;小脇 光男;杉井 学;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;杉井学;小脇光男;杉井学;Yoichi TSUGE;小脇光男;杉井学;乾 秀行;乾 秀行;乾 秀行;小脇 光男;杉井 学;乾秀行
    葉山アツコ;葉山アツコ;Hayama Atsuko;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;柘植洋一;乾秀行;乾秀行;小脇光男;柘植洋一;乾秀行;柘植洋一;乾 秀行;柘植 洋一;小脇 光男;杉井 学;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;杉井学;小脇光男;杉井学;Yoichi TSUGE;小脇光男;杉井学;乾 秀行;乾 秀行;乾 秀行;小脇 光男;杉井 学;乾秀行
  • 通讯作者:
    乾秀行
    乾秀行
地方と都市のバスケト語母語話者の言語使用
城乡篮球母语者的语言使用情况
  • DOI:
  • 发表时间:
    2008
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    葉山アツコ;葉山アツコ;Hayama Atsuko;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;柘植洋一;乾秀行;乾秀行;小脇光男;柘植洋一;乾秀行;柘植洋一;乾 秀行;柘植 洋一;小脇 光男;杉井 学;乾秀行;乾秀行;乾秀行
    葉山アツコ;葉山アツコ;Hayama Atsuko;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;葉山アツコ;乾秀行;乾秀行;乾秀行;柘植洋一;小脇光男;柘植洋一;乾秀行;乾秀行;小脇光男;柘植洋一;乾秀行;柘植洋一;乾 秀行;柘植 洋一;小脇 光男;杉井 学;乾秀行;乾秀行;乾秀行
  • 通讯作者:
    乾秀行
    乾秀行
On the development of e-learning material for the information security education
浅谈信息安全教育电子教材的开发
共 20 条
  • 1
  • 2
  • 3
  • 4
前往

相似海外基金

肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
  • 批准号:
    24K15796
    24K15796
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
    Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
  • 批准号:
    24K13948
    24K13948
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
    Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
  • 批准号:
    24K13518
    24K13518
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
    Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
  • 批准号:
    24K15093
    24K15093
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
    Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
  • 批准号:
    24K15095
    24K15095
  • 财政年份:
    2024
  • 资助金额:
    $ 2.83万
    $ 2.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
    Grant-in-Aid for Scientific Research (C)