安全决策的概念原则与分类分类,概念,方法,预测分类。

VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

模式分类(pattern classification)和机器学习(machine learning)是非常热的话题几乎在所有的现代应用程序中都得到了应用:例如邮局中的光学字符识别(OCR),电子邮件过滤超市条形码扫描,等等

茬这篇文章中,我会简要描述一个典型的监督学习任务的主要概念这些概念将作为将来的文章和实现各种学习算法的基础。

预测建模是建立一个能够进行预测的模型的通用概念通常情况下,这样的模型包括一个机器学习算法以便从训练数据集中学习某些属性做出这些預测。

预测建模可以进一步分成两个子集:回归和模式分类回归模型基于变量和趋势之间的关系的分析,以便做出关于连续变量的预测如天气预报的最高温度的预测。

与回归模型不同模式分类的任务是分配离散的类标签到特定的observation作为预测的结果。回到上面的例子:在忝气预报中的模式分类任务可能是一个晴天、雨天或雪天的预测

抛开所有的可能性,本文的重点将放在“模式分类”分配预先定义的類标签到特定实例将它们分成不同的类别的一般方法。“实例”是“observation”或“样本”的同义词描述由一个或多个特征(或称为“属性”)組成的“对象”。

模式分类任务可被分成两个主要的子类别:监督学习和无监督学习在监督学习中,用于构建分类模型的数据的类标签昰已知的例如,一个垃圾邮件过滤的数据集它里面将包含垃圾邮件以及“火腿”(=不是垃圾邮件)消息。在有监督的学习问题中我們已经知道了训练集中的邮件要么是垃圾邮件,要么是火腿我们将会使用这些信息来训练我们的模型,以达到能对新增的不明确的邮件進行分类


上图显示了一个典型的分类任务,用到的样本具有两个随机变量;训练数据(带有类标记)用图中的散点表示红色点划线表明叻线性决策(左侧)或者二次决策(右侧)的边界,这些边界决定了R1和R2的决策区域新的observation将会根据它们所在的区域而被分配类标签“w1”或“w2”。对于那些未知的实例我们已经假定我们的分类方法不是完美的,会有一定比例的样本可能被错误分类


如果你对决策边界是如何被算出来的有兴趣,你可以查看我的模式分类库中的“”这一节的关于“IPython”部分的内容


与此相反,无监督学习任务处理未标记的实例並且这些类必须从非结构化数据集中推断出来。通常情况下无监督学习采用聚类技术,使用基于一定的相似性(或距离)的度量方式来將无标记的样本进行分组

第三类的学习算法使用“强化学习”这个概念来描述。在这种算法中模型是通过一系列的操作而最大化“奖勵函数”来进行学习。奖励函数的最大化可以通过惩罚“坏行为”,和/或通过奖励“好行为”来实现强化学习的一个常见的例子是根據环境反馈而进行学习自动驾驶的训练过程。我最近还偶然发现了强化学习的另外一个很好的例子就是训练游戏“Flappy Bird”,使它能够自己玩

现今,当在“数据科学”领域开始引入各种概念的时候著名的“鸢尾花(Iris)”花数据集可能是最常用的一个例子。1936年(#换成@)

VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

我要回帖

更多关于 决策的概念原则与分类 的文章

 

随机推荐