当前位置: 首页 > news >正文

什么网站可以学习建设工程法律实践注册服务公司流程和费用

什么网站可以学习建设工程法律实践,注册服务公司流程和费用,如何做地方网站,求一个好看的网站相关文章 K近邻算法和KD树详细介绍及其原理详解朴素贝叶斯算法和拉普拉斯平滑详细介绍及其原理详解决策树算法和CART决策树算法详细介绍及其原理详解 文章目录相关文章前言一、决策树算法二、CART决策树算法2.1 基尼系数2.2 CART决策树算法总结前言 今天给大家带来的主要内容包…相关文章 K近邻算法和KD树详细介绍及其原理详解朴素贝叶斯算法和拉普拉斯平滑详细介绍及其原理详解决策树算法和CART决策树算法详细介绍及其原理详解 文章目录相关文章前言一、决策树算法二、CART决策树算法2.1 基尼系数2.2 CART决策树算法总结前言 今天给大家带来的主要内容包括决策树算法、基尼系数和CART决策树算法。废话不多说下面就是本文的全部内容了 一、决策树算法 假设有这么一个例子小明毕业后来到一家银行当行长上班第一天就有15位客人申请了贷款刚刚入行的小明仔细整理了客户的基本信息这些基本信息包括 是否有工作是否有固定资产信誉是否良好 经过深思熟虑后小明逐一审查了这15份申请并做了相应批复 图1贷款申请审批结果 但是小明觉得这工作量实在是太大了如果可以想一个办法快速的判断一个用户是否可以申请贷款呢 图2可否自动分类得到贷款的审批结果 经过几天几夜的努力思考后小明根据客户的基本信息尝试得出结论 按照工作为标准。其中五个有工作的用户都被批准了而另外十个没有工作的客户有四个被批准了六个被拒绝了 图3按照工作为标准审批贷款申请 如果以少数服从多数为原则的话可以得出结论有工作的客户就会被批准而没有工作的客户就会被直接拒绝。以上方法得到的结果显然和样本绝大部分的结果都相悖所以按照工作为标准并不可行 按照信誉为标准。其中四个信誉非常好的客户被批准了信誉良好的有四个客户被批准两个被拒绝而信誉一般的只有一个客户被批准四个被拒绝 图4按照信誉为标准审批贷款申请 如果仍以少数服从多数为原则的话那么可以得出结论信誉非常好或者好的客户就会被批准而信誉一般的客户就直接拒绝。以上方法得到的结果显然和样本绝大部分的结果仍然都相悖所以按照信誉为标准也不可行 按照工作和信誉为标准。首先考虑工作因素其中有工作的客户被分类得很好全部客户的申请都被批准了没有特例而没有工作的客户既有批准的也有拒绝的。然后按照信誉的等级将剩下的客户分类可以看到其中信誉非常好的客户和信誉一般的客户都被分类得很好要不申请都批准了要不都拒绝了没有特例而信誉好的客户的申请更偏向于拒绝 图5按照工作和信誉为标准审批贷款申请 还是以少数服从多数为原则可以得出结论如果客户有工作那么可以批准贷款如果没有工作我们再考虑他的信誉情况做出判断。通过以上方法得到的结果的正确率显然比前两种方法的正确率更高一些。这种方法就是利用决策树Decision Tree算法进行决策分类的过程这种方法称为决策树算法的原因就是因为通过判断得到结果的过程分支很像一棵树故而得名决策树算法 当小明发现决策树算法可以帮他快速进行客户申请的结果判断后他非常高兴。假设此时有一个新客户的贷款申请此客户没有工作但是信誉非常好忽略房子的因素小明就可以按照上面介绍的决策树算法直接得出结论 图6使用决策树算法直接得到贷款审批结果 在刚才的决策树算法中我们先按照是否有工作分类又按照信誉等级进行分类并且只考虑了这两种因素。那么我们目前就面临两个问题 如果先按照信誉等级分类再按照工作分类可不可以呢如果把是否有房子这个因素也考虑在内又该按照什么顺序来选择标准呢 图7如何选择分类标准 二、CART决策树算法 2.1 基尼系数 刚才我们提到了应该如何构建决策树呢应该如何选择合理的因素呢又应该如何选择多个因素合理的顺序呢也就是说我们应该选择一个合理的标准来作为决策树的分类节点这个时候我们就需要对我们选择的标准进行好坏的判断而标准的好坏可以用一个值来定义这个值被称为基尼系数Gini Index Gini⁡1−∑k1Kpk2\operatorname{Gini}1-\sum_{k1}^{K} p_{k}^{2} Gini1−k1∑K​pk2​ 其中pk(1≤k≤K)p_{k}(1≤k≤K)pk​(1≤k≤K)是某一类别出现的概率所以基尼系数的定义就是1减去所有类别出现的概率的平方和。根据以上定义就可以得到在我们这个二元分类问题中的基尼系数为 Gini1−p(批准)2−p(拒绝)2Gini1-p(\text{批准})^{2}-p(\text{拒绝})^{2} Gini1−p(批准)2−p(拒绝)2 刚才我们也提到了可以使用基尼系数来确定当前标准的好坏 当基尼系数越大时此标准的不确定性越大说明此标准较坏当基尼系数越小时此标准的不确定性越小说明此标准较好 所以基尼系数的含义为当前标准的不确定程度以上面的例子举例来说 当p(批准)1,p(拒绝)0p(\text{批准})1,p(\text{拒绝})0p(批准)1,p(拒绝)0时 Gini1−1−00Gini1-1-00 Gini1−1−00 当p(批准)0,p(拒绝)0p(\text{批准})0,p(\text{拒绝})0p(批准)0,p(拒绝)0时 Gini1−0−10Gini1-0-10 Gini1−0−10 当p(批准)0.5,p(拒绝)0.5p(\text{批准})0.5,p(\text{拒绝})0.5p(批准)0.5,p(拒绝)0.5时 Gini1−0.25−0.250.5Gini1-0.25-0.250.5 Gini1−0.25−0.250.5 我们也可以通过下图更直观的看出基尼系数随概率的变化。我们可以看到当客户一定被拒绝或者一定被批准的情况下这种确定性会得到一个接近于零的基尼系数而如果我们认为客户被拒绝和批准的概率一样时基尼系数值会达到最大值。 图8基尼系数值与某种情况概率的联系 2.2 CART决策树算法 那么根据以上分析我们只需要选择基尼系数最小的条件来作为决策树下一级分类的标准就可以了。再回到我们上面讲述的例子中。首先我们不考虑任何标准根据贷款结果直接计算数据的基尼系数 图9根据贷款结果直接计算数据的基尼系数 可以看到当我们不选用任何标准时的基尼系数非常大此时的数据类似于随机生成的这也就意味着当前的贷款结果有着很大的不确定性。 很明显不考虑任何标准就莽撞地分类那么分类结果一定不好所以我们应该考虑选取最佳的分类标准我们首先考虑“工作”这个分类标准整个计算过程如下所示 图10计算以“工作”作为分类标准的基尼系数 首先计算有工作的客户的基尼系数因为这些客户都获得了批准所以基尼系数为零然后同样根据基尼系数公式得到没有工作的客户的基尼系数为0.48最后通过加权的方式并求和就可以得到以工作为分类标准的最终基尼系数为0.32 以此类推按照上面的做法我们也可以计算得到以房子和信誉作为分类标准的基尼系数 图11分别计算以“房子”和“信誉”作为分类标准的基尼系数 我们比较上面计算得到的四个基尼系数可以发现以房子作为分类结果的基尼系数最小所以我们应该首先按照“房子”这个分类标准来构建决策树 图12以“房子”作为分类标准来构建决策树 如果客户有房子可以直接批准他的贷款所以决策树左边的节点已经被分类好了那如果客户没有房子我们也不能直接拒绝客户的贷款而是应该考虑决策树右边节点的标准这个时候我们只需要考虑那些没有房子的客户就可以了以这些没有房子的客户样本作为新的集合计算剩余所有标准的基尼系数 图13将没有房子的客户视为新的集合重新计算剩余所有标准的基尼系数 可以看到其中以工作作为分类标准的基尼系数为零是最低的基尼系数值所以我们选择工作作为下一步分类的标准 图14选择“工作”作为下一步分类的标准 这样我们就把所有的类别都分类好了这就是决策树的生成过程。这种以基尼系数为核心的决策树算法就称为CART决策树算法Classification and Regression Tree。 另外还有一点需要注意我们一般看到的决策树都是二叉树的构造形式这只是一种个人选择并不是强制要求。这样做的目的只是为了方便处理连续的变量如果样本分布在0~100之间在没有具体的切割要求下我们一般取平均数作为切割点这样就自然地生成了一棵二叉树。 图15分布在0~100的样本一般取平均数作为切割点 总结 以上就是本文的全部内容了这个系列还会继续更新给大家带来更多的关于机器学习方面的算法和知识下篇博客见
http://www.yingshimen.cn/news/2705/

相关文章:

  • 新闻类网站备案 100万火山软件开发平台官网
  • 睢宁网站制作火车头采集wordpress规则
  • 网站元素优化 移动站个人网站开发实例
  • 做个网站怎样做的wordpress修改头像
  • 网站 备案号 放置专业别墅设计装修
  • 兰州网站制作服务电话单页个人主页网页设计代码
  • 泽库县公司网站建设wordpress epanel
  • 求个没封的w站2021软件外贸公司应该怎样做外贸网站
  • 做玩网站怎么上传wordpress子域名
  • 如何做购物网站推广软件做网站
  • 汕头网站建设推广平台大连开发区天气预报
  • 百度能做网站建设吗现在做网站建设挣钱吗
  • 网站建设需求调查表廊坊seo优化公司
  • 做嗳嗳的网站加强普法网站和普法网络集群建设
  • 建设网站找什么问题晋中做网站公司
  • 做网站要会什么邙山郑州网站建设
  • cms网站搭建昌平做网站的公司
  • 正规网站建设价格有做h的小说网站
  • 机械网站建设公司sns社交网站 有哪些
  • 像做游戏一样编程的网站包头seo排名
  • 网站 站外链接网站建设前端岗位职责
  • 支付宝 外贸网站亚马逊购物商城
  • 网站营销策略组合毕设做网站需要准备
  • 购物网站开发原理手机网站合同
  • 合作网站制作ui设计招聘
  • 山东省建设人才网站古典家具网站模板
  • 外贸网站如何seowordpress首页404
  • 网站建设互联网营销营销推广各种网站推广是怎么做的
  • 门户网站优化方案正规建网站公司
  • 网站发布与推广方式网站建设域名怎么收费的