`
gaofen100
  • 浏览: 1187381 次
文章分类
社区版块
存档分类
最新评论

概念描述:面向数据库的方法与机器学习的方法比较

 
阅读更多
1. 面向数据库的方法:面向大型数据库的概念描述的概化方法
使用基于数据立方体的方法 或者 面向属性的归纳的方法
2. 机器学习:使用示例学习的范例,在概念集或标定训练样本集上进行,通过检验这些集合在学习中导出关于描述类的假定

差异:

所用的基本原理不同,关于概念描述的基本假定也不同
1) 在示例学习的范例中,分析样本划分为两个集合:正样本和负样本,正样本用于概化,负样本用于特化,最后的概念描述会覆盖所有正样本而不覆盖任何负样本
2) 在面向数据库的方法中,只存在正样本,因此大部分面向数据库的方法都是基于概化的(使用该方法时,下钻操作用于回溯到前一状态的概化过程)

训练样本集大小上的差异
1) 机器学习训练样本集小,容易找到覆盖所有正样本而不覆盖任何负样本的描述
2) 面向数据库的方法通常面对大量数据,因此概念描述的目标是尽量的涵盖正面数据(概率分布)

所使用的概化方法不同
1) 机器学习方法是逐个元组的进行概化
2) 面向数据库的方法是逐个属性(或维)的进行概化,从而使得数据挖掘的过程能够与面向集合的数据库操作集成

分享到:
评论

相关推荐

    数据库系统概论第四版答案

    文件系统与数据库系统的区别是:文件系统面向某一应用程序,共享性差,冗余度大,数据 独立性差,记录内有结构,整体无结构,由应用程序自己控制。数据库系统面向现实世界, 共享性高,冗余度小,具有较高的物理独立...

    KnowledgeGraphCourse.zip

    6.3 基于机器学习的实体识别方法 6.4 基于深度学习的实体识别方法 6.5 基于半监督学习的实体识别方法 6.6 基于迁移学习的实体识别方法 6.7 基于预训练的实体识别方法 第7讲 知识抽取:关系抽取(2019-4-19,2019-4-...

    商业智能的概念.doc

    数据挖掘(DM)是一种决策支持过程,它主要基于AI、机器学习、统计学等技术, 高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测 客户的行为,帮助企业的决策者调整市场策略,减少...

    大数据分析方法.pdf

    与数据挖掘相近的同义词有数据融合、人工智能、商务智能、模式识别、机器学习、知 识发现、数据分析和决策支持等。 ----何为知识从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规 则、模式、规律...

    软件工程知识点

    比较常用的需求有效性验证方法与工具包括:需求评审、需求原型评价和基于CASE工具的需求一致性分析。 6.需求规格定义 需求规格说明书是需求分析阶段需要交付的基本文档,将成为开发者进行软件设计和用户进行软件验证...

    大数据的统计学基础(2).pdf

    课程内容: 第 1 课 面向小白的统计学:描述性统计(均值,中位数,众数,方差,标准差, 与常见的统计图表) 第 2 课 赌博设计:概率的基本概念,古典概型 第 3 课 每人脑袋里有个贝叶斯:条件概率与贝叶斯公式,...

    大数据:数据清洗、数据分析、数据挖掘.doc

    数据挖掘通常与计算机科学有关,并通过统计、在线分析处 理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来 实现上述目标。 折叠数据挖掘的基本步骤 数据挖掘的步骤会随不同领域的应用...

    软件工程工资管理系统

    该公司是一家刚刚成立的公司,总体人员比较少,有正式员工20人,人员结构比较简单,学历比较高,基本拥有大专以上学历,部门划分也很清晰,而且人员的流动性不高,所以公司目前对工资管理的要求不高。因此,针对该...

    Data-Mining培训资料.docx

    典型的聚类算法包括k-means 算法、PAM 算法、因素分析 、机器学习方法及神经网络方法等。 分类分析技术 Data-Mining培训资料全文共7页,当前为第3页。分类分析就是通过分析示例数据库中的数据,为每个类别做出准确...

    XML高级编程

    XML的可视化显示 XML的数据处理对于在机器之间移动数据来说是再好不过了,但是如果你要把XML传递给人的话,就会对它的样式处理比较感兴趣。和大多数注重于数据的传统计算领域(例如关系型数据库)不同,XML的研究者...

    数据清洗数据分析数据挖掘.docx

    数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 数据挖掘的基本步骤 数据挖掘的步骤会随不同领域的应用而有所...

    数据清洗、数据分析、数据挖掘.docx

    数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 折叠数据挖掘的基本步骤 数据挖掘的步骤会随不同领域的应用而...

    数据清洗-数据分析-数据挖掘.docx

    数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。 折叠数据挖掘的基本步骤 数据挖掘的步骤会随不同领域的应用而...

    Visual C++ 2005入门经典--源代码及课后练习答案

    本书延续了Ivor Horton讲解编程语言的独特方法,从中读者可以学习Visual C++ 2005的基础知识,并全面掌握在MFC和Windows Forms中访问数据源的技术。此外,本书各章后面的习题将有助于读者温故而知新,并尽快成为C++...

Global site tag (gtag.js) - Google Analytics