当前位置: 首页 > news >正文

个人网站建设步骤网页怎么制作动画

个人网站建设步骤,网页怎么制作动画,百度关键词排名查询工具,网站游戏制作开发一、说明 马哈拉诺比斯距离#xff08;Mahalanobis Distance#xff09;是一种测量两个概率分布之间距离的方法。它是基于样本协方差矩阵的函数#xff0c;用于评估两个向量之间的相似程度。Mahalanobis Distance考虑了数据集中各个特征之间的协方差#xff0c;因此比欧氏距… 一、说明         马哈拉诺比斯距离Mahalanobis Distance是一种测量两个概率分布之间距离的方法。它是基于样本协方差矩阵的函数用于评估两个向量之间的相似程度。Mahalanobis Distance考虑了数据集中各个特征之间的协方差因此比欧氏距离更适合用于涉及多个特征的数据集。Mahalanobis Distance可以应用于各种机器学习算法中如聚类分析、分类算法和异常检测。 维沙尔·夏尔马   二、基本概念介绍         马氏距离是一种统计工具用于测量点和分布之间的距离。它是一种强大的技术可考虑数据集中变量之间的相关性使其成为各种应用如异常值检测、聚类和分类中的宝贵工具。         例如让我们考虑一个场景其中一家公司想要识别信用卡交易中的潜在欺诈行为。该公司收集有关各种变量的数据例如交易金额位置时间和其他信用卡交易详细信息。然后它使用马氏距离来测量每笔交易与所有交易分布之间的距离。通过这样做它可以识别与其他交易明显不同的交易并可能表明欺诈活动。         马氏距离测量点和分布之间的距离考虑数据中变量之间的相关性。它是点 x 与具有平均向量 μ 和协方差矩阵 Σ 的分布之间的距离。马氏距离的公式如下 D² x-μTΣ⁻¹x-μ         其中 D² 是平方马氏距离x 是相关点μ 是分布的平均向量Σ 是分布的协方差矩阵T 表示矩阵的转置。         为了更好地理解这个公式让我们举一个例子。假设我们有一个包含两个变量 X 和 Y 的数据集并且我们想要测量一个点 2 3 与数据集中所有点的分布之间的距离。我们计算数据集的平均向量和协方差矩阵如下     μ [mean(X), mean(Y)] [3, 4]     Σ [[var(X), cov(X,Y)], [cov(X,Y), var(Y)]] [[2, -1], [-1, 2]]           现在我们可以使用马氏距离公式来计算点 2 3 和分布之间的距离 D² [2 3]-[3 4]T[[2 -1] [-1 2]]⁻¹[2 3]-[3 4] [-1 -1]T[[2 -1] [-1 2]]⁻¹[-1 -1] [2 -2]T[[2/3 1/3] [1/3 2/3]][2 -2] [2/3 -2/3]T[2 -2] 4/3。         因此点 2 3 与分布之间的马氏距离平方为 4/3。通过计算马氏距离我们可以确定点与分布的距离考虑 X 和 Y 变量之间的相关性。 import numpy as np from scipy.spatial.distance import mahalanobis from sklearn.datasets import make_blobs# Create a dataset with 2 clusters X, y make_blobs(n_samples100, centers2, random_state42)# Calculate the mean vector and covariance matrix of the dataset mu np.mean(X, axis0) sigma np.cov(X.T)# Calculate the Mahalanobis Distance between two points x1 [2, 2] x2 [-2, -2] dist_x1 mahalanobis(x1, mu, np.linalg.inv(sigma)) dist_x2 mahalanobis(x2, mu, np.linalg.inv(sigma))# Print the distances print(Distance between point x1 and the distribution:, dist_x1) print(Distance between point x2 and the distribution:, dist_x2)#OUTPUTDistance between point x1 and the distribution: 2.099478227196236 Distance between point x2 and the distribution: 8.065203145117373 以下是如何使用马氏距离的一些示例 异常值检测马氏距离可以检测数据集中的异常值。异常值是与数据集其余部分明显不同的数据点。通过计算每个数据点与数据集平均值之间的马氏距离我们可以识别远离平均值的数据点。这些数据点可被视为异常值可能需要删除或进一步调查。聚类马氏距离也可用于聚类数据点。聚类是将相似的数据点分组在一起的过程。通过计算每个数据点之间的马氏距离和每个聚类的平均值我们可以确定数据点属于哪个聚类。此方法可用于对具有不同方差或协方差的数据点进行聚类分析。图像分类 马氏距离可用于图像分类任务。此应用程序使用马氏距离来测量测试图像和一组训练图像之间的相似性。通过计算测试图像和每个训练图像之间的马氏距离我们可以确定哪个训练图像与测试图像最相似。此方法对于人脸识别和对象检测等任务很有用。欺诈检测马氏距离可用于金融交易中的欺诈检测。通过计算一笔交易和一组历史交易之间的马氏距离我们可以确定该交易是不寻常的还是可疑的。此方法可用于检测可能被忽视的欺诈易 以下是如何使用马氏距离的一些示例 三、示例 下面是如何使用马哈拉诺比斯距离为现实生活中的数据集创建美丽图的示例         在本例中让我们使用著名的鸢尾花数据集其中包含 150 朵鸢尾花的测量值。我们将使用萼片长度、宽度和花瓣长度作为我们的特征。 首先我们将计算数据集中每个数据点的马氏距离。我们可以在 Python 中使用以下代码来做到这一点 import numpy as np from scipy.spatial.distance import mahalanobis# load the iris dataset from sklearn.datasets import load_iris iris load_iris()# calculate the mean and covariance matrix of the dataset mean np.mean(iris.data, axis0) cov np.cov(iris.data.T)# calculate the Mahalanobis distance for each data point mahalanobis_dist [mahalanobis(x, mean, np.linalg.inv(cov)) for x in iris.data] 接下来我们可以使用前两个特征萼片长度和萼片宽度创建虹膜数据集的散点图并根据其马氏距离为每个数据点着色。我们可以使用颜色图将马氏距离映射到色标。这是该图的代码 import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap# create a color map for the Mahalanobis distances cmap ListedColormap([r, g, b]) norm plt.Normalize(min(mahalanobis_dist), max(mahalanobis_dist))# create a scatter plot of the iris dataset plt.scatter(iris.data[:, 0], iris.data[:, 1], cmahalanobis_dist, cmapcmap, normnorm)# add a color bar plt.colorbar() plt.xlabel(sepal length) plt.ylabel(sepal width) plt.title(Mahalanobis Distance for Iris Dataset) plt.show()         生成的图显示了鸢尾花数据集每个数据点根据其马氏距离着色。远离平均值的数据点即异常值以红色显示而接近平均值的数据点以绿色和蓝色着色。         下面是另一个使用sci-kit-learn库附带的著名Wine数据集的示例 import numpy as np from scipy.spatial.distance import mahalanobis import pandas as pd from sklearn.datasets import load_wine import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap# load the wine dataset wine load_wine() wine_df pd.DataFrame(wine.data, columnswine.feature_names)# calculate the mean and covariance matrix of the dataset mean np.mean(wine_df, axis0) cov np.cov(wine_df.T)# calculate the Mahalanobis distance for each data point mahalanobis_dist [mahalanobis(x, mean, np.linalg.inv(cov)) for x in wine_df.values]# create a scatter plot of the wine dataset using two highly correlated features plt.scatter(wine_df[flavanoids], wine_df[color_intensity], cmahalanobis_dist, cmapcoolwarm)# add a color bar plt.colorbar() plt.xlabel(flavanoids) plt.ylabel(color_intensity) plt.title(Mahalanobis Distance for Wine Dataset) plt.show()         两个高度相关的特征类黄酮和color_intensity的散点图每个数据点根据其马氏距离着色。 “Unlocking the Power of Mahalanobis Distance: Exploring Multivariate Data Analysis with Python” | by Vishal Sharma | Medium 机器学习 数据科学 蟒 统计学 数据可视化
http://www.yingshimen.cn/news/16671/

相关文章:

  • 长沙网页建站wordpress伪装插件
  • 西安网站制作公司哪哪个网站不花钱可以做招聘
  • 企业标准网上备案网站网页打包成app免费
  • 如何自建网站做外贸网站建设常用结构类型
  • 做网站用 jsp还是asp那个网站可免费做推广
  • 旅游网站设计的目的网站主题模板下载安装
  • .net 网站开发视频双语网站怎么做的
  • dw做的网站有什么缺陷海南省住房公积金管理局app
  • 菏泽建设局网站福建手机版建站系统开发
  • 厦门市建设局网站住房保障专栏网站改版 升级的目的是什么意思
  • nike官网宣传片河南网站开发优化
  • 爱站网影院网站管理工作
  • 廊坊建设企业网站公司注册网站入口
  • 衡水企业做网站推广指数搜索
  • 手机网站视频怎么下载施工企业质量月活动总结报告
  • 销售手机网站python语言编程入门
  • 搭建影视网站违法wordpress 总访问统计
  • 福州市建设工程工料机信息网站wordpress 后台 字数统计
  • 会网站开发维护的ps什么岗位响应式网站模板 食品
  • 网站访问对应二级域名建设银行网站在哪里修改支付密码
  • 设计购物网站小说网站风格
  • 免费建设网站的画出网站建设手机端管网
  • 深圳网站搭建找哪里一般做海报的图片跟哪个网站下载
  • php如何做网站局域网及网站建设内容
  • 舒城县建设局网站首页wordpress旧版本下载
  • 建站公司合肥2012r2网站建设
  • 禁止wordpress网站上传图片时自动生成三张图片方法展厅布展方案设计
  • 主流网站宽度苏州高端网站建设机构
  • 教育技术学网站模版开州快速建网站
  • 嘉兴网站开发学校网站在建设时不容忽略的一些细节