假设检验是
推论统计中用于检验统计假设的一种方法。而“统计假设”是可通过观察一组
随机变量的模型进行检验的科学
假说。一旦能估计未知
参数,就会希望根据结果对未知的真正参数值做出适当的推论。
统计上对参数的假设,就是对一个或多个参数的论述。而其中欲检验其正确性的为
零假设(null hypothesis),零假设通常由研究者决定,反映研究者对未知参数的看法。相对于
零假设的其他有关参数之论述是
备择假设(alternative hypothesis),它通常反应了执行检定的研究者对参数可能数值的另一种(对立的)看法(换句话说,备择假设通常才是研究者最想知道的)。
关联规则学习(英语:Association rule learning)是一种在大型数据库中发现变量之间的有趣性关系的方法。它的目的是利用一些有趣性的量度来识别数据库中发现的强规则。基于强规则的概念,Rakesh Agrawal等人引入了关联规则以发现由超市的
POS系统记录的大批交易数据中产品之间的规律性。例如,从销售数据中发现的规则 {洋葱, 土豆}→{汉堡} 会表明如果顾客一起买洋葱和土豆,他们也有可能买汉堡的肉。此类信息可以作为做出促销
定价或产品植入等营销活动决定的根据。除了上面购物篮分析中的例子以外, 关联规则如今还被用在许多应用领域中,包括网络用法挖掘、
入侵检测、
连续生产及
生物信息学中。与序列挖掘相比,关联规则学习通常不考虑在事务中、或事务间的项目的顺序。
统计学,
数据挖掘和
机器学习中的决策规则训练,使用
决策树作为
预测模型来预测样本的类标。这种决策树也称作分类树或回归树。在这些树的结构里,
叶子节点给出类标而内部节点代表某个属性。
在决策分析中,一棵决策树可以明确地表达决策的过程。在
数据挖掘中,一棵决策树表达的是数据而不是决策。
粗糙集(rough set),又称粗集合。在
粗糙集理论中,明确集(crisp set)是指传统的
集合,而粗糙集则用于对明确集进行形式上的逼近,即给出该明确集的上逼近集和下逼近集。此理论最初由波兰数学家Zdzisław I. Pawlak所描述,也被视为标准的粗糙集理论。在这标准理论中,上逼近集和下逼近集都是明确集,而在其它一些版本的粗糙集理论中则是
模糊集。
机器学习是
人工智能的一个分支。人工智能的研究历史有着一条从以“
推理”为重点,到以“
知识”为重点,再到以“
学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。机器学习在近30多年已发展为一门多领域
交叉学科,涉及
概率论、
统计学、
逼近论、
凸分析、
计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让
计算机可以自动“
学习”的
算法。
机器学习算法是一类从
数据中自动分析获得
规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与
推断统计学联系尤为密切,也被称为
统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多
推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。
监督学习和
非监督学习的差别就是训练集目标是否人标注。他们都有训练集 且都有输入和输出