创意广告设计网站,汤臣杰逊品牌策划公司,wordpress 5.1.1,现在的网站设计未分配的题目 概率计算#xff08;一些转换公式与全概率公式#xff09;与实际概率 #xff0c;贝叶斯
一些转换公式 相关性质计算
常规#xff0c;公式的COV与P
复习相关公式 计算出新表达式的均值#xff0c;方差#xff0c;再套正态分布的公式 COV的运算性质
如…未分配的题目 概率计算一些转换公式与全概率公式与实际概率 贝叶斯
一些转换公式 相关性质计算
常规公式的COV与P
复习相关公式 计算出新表达式的均值方差再套正态分布的公式 COV的运算性质
如果两变量独立那么EXYEXEY
算COVXY,就是EXY-EXEY E(X[X]),对于带绝对值的均值直接进行积分利用积分的对称关系求解
期望表达式中的式子就是每个点对应的函数式的值。 面积为ΠR^2派为常数所以面积的期望取决于X^2的期望方差取决于X^2的方差
COV(S,C)最终可化简为COVR,R^2)E(R*R^2)-E(R)E(R^2)
X^2的方差计算一下X^4的积分一共要算X^3,X^4两个积分 对于此类型的X,Y变化满足变化后的量均值为0方差为1
奇怪,不规则的COV,P
一般就是离散的二维变量X,Y。核心就是依据题目特点写出X,Y的离散分布表然后就计算EXY,EX,EY,EX^2,EY^2,DX,DY等关键数据
即主要是考分布律的求解 联合分布律直接联合各变量可能出现的所有离散值列表然后分别计算格子上各种情况的概率就变得一目了然了 直接依照各变量可能取值列表然后明确每个格子所代表的实际含义再进行概率计算即可 标准差等的均值方差性质
样本均值就是分布均值与取样数量N无关样本方差为分布方差除以N。
样本均值的均值是分布均值。
样本方差
样本均值为X拔样本均值的均值就是总体均值
样本均值的方差是总体方差除以N
样本方差为S的平方样本方差的均值等于总体的方差
区分样本均值的方差与样本方差
还需要区分的是样本均值与样本即X拔与XX与μX拔与μ
另外对于样本方差的方差考虑构建卡方分布
即样本方差为N-1除以总体方差后可以转为N-1的卡方分布然后样本方差的方差可以转化为卡方分布的方差卡方分布的方差为二倍的自由度 两种方法一种是转为自由度为1的卡方分布然后注意卡方分布的方差为2^N,均值为N一种是利用方差的定义即样本减去均值的差的均值满足这个式子所以就是在问样本方差为原样本方差除以取样数量
还有一种思路是涉及均值绝对值等要素组合在一起时考虑直接积分利用正态分布的对称性进行求解。 ES^2DX,E(X拔^2)D(X拔E(X拔^2,
D(X拔1/nDX,E(X拔EX 常见分布
正态分布公式背写 常见分布缩写P是泊松E是指数G是几何分布
常见分布的期望与方差泊松的期望就是朗姆达方差
指数的期望是1/朗姆达方差为1/朗姆达的平方。理解为指数分布的含义为等待时间参数朗姆达的含义为发生次数即频率所以平均等待时间为频率事件间的间隔1/朗姆达
几何分布在指数分布的基础上就只是方差还要再多乘一个1-p,即1-参数
二项分布为期望为np,方差为np(1-p) 对于后一项的处理方式为直接积分即回归期望的定义。
对于期望式中难以处理的部分如绝对值以及其他不能转换的部分可以考虑直接通过期望定义来进行积分计算 第一空就是直接离散化计算概率不用考虑卷积公式。第二问就是直接展开利用独立分布时EXYEXEY进行计算 此题需要注意平均就诊时间是参数的倒数参数的含义 是一定时间内事件发生的次数、频率所以间隔时间是参数的倒数
密度朗姆达E^-朗姆达分布1-E^-朗姆达 总点击次数为4类似前题直接离散化穷举计算即可
两个都服从泊松分布第一个参数为3第二个参数为2。用卷积公式这两个是独立的然后有一个联合密度函数就在那个联合密度函数上进行卷积公式。也不用卷积公式直接离散化的穷举计算即可 满足指数分布可以直到各自的均值与方差然后由相关系数知道均方差均方差EXY-EXEY就求出EXY
指数分布的均值为参数的倒数方差为参数倒数的平方也是均值的平方
泊松分布的均值为参数方差也为参数
几何分布的均值为参数的倒数方差为参数倒数的平方基础上再乘个Q 基于标准正态分布间的转化
卡方分布是直接相加
T分布是分子为一个标准正态卡方为分布除以其自由度后开根号 。T的自由度就是分母卡方的自由度
F分布分子分母均为卡方除以其自由度后开根号
样本方差除以方差可以转化为卡方分布
从而样本方差在分子上时可为卡方分布在分母上是为标准差的形式则为除以自由度后开根号即T分布。分子分母都有样本方差考虑F分布
即出现样本方差就需要考虑到卡方分布T分布,F分布 X与Y独立且都为标准正态分布那么平方加和为自由度为2的卡方分布找分位点即可
相同原理可以应用于炮弹落点为X,Y)且X,Y独立满足标准正态分布那么落地到原点的距离Z满足Z^2X^2Y^2,即Z^2服从自由度为2的卡方分布 第一空直接运算就是自由度为6的卡方分布 DS^2考虑构造卡方分布N-1)S^2/方差为自由度为N-1的卡方分布然后卡方分布的方差为两倍的自由度即可得;第二空为自由度为N-1的T分布T分布的均值为0方差为N/N-2;第三空为自由度为1的卡方分布 第一空为自由度为N的卡方分布第二空为F分布分子自由度为N分母为M 注意分母的i是从3开始1而不是从1开始的还有就是T分布与F分布一定要注意除以各自的自由度 注意第一个空为样本均值减完后其分布满足均值为0因为样本均值的均值等于总体均值
但要注意它的方差样本均值不是一个常量而是一个变量如果为常量如总体均值那么这个分布的方差不会变但是为样本均值它的方差为总体方差除以n,但是依然不能直接运算因为X1与样本均值不独立应把其拆为独立的部分后再进行运算
对于第二问涉及到样本均值就一定会有样本方差考虑自由度减1不可用第一问的结论因为这N个分布并不相互独立而卡方分布必须满足相加的各几个分布相独立
统计量的性质
无偏估计
若为无偏估计那么统计量的均值为数值期望 三个想法第一是直接拆开然后进行运算第二是构建辅助分布然后利用卡方分布第三同样是辅助分布但是是利用EX^2转方差的性质。
这里需要注意是可以成功构建一个卡方分布的因为两两样本间的差值是相互独立的但是需要注意上例中涉及到样本均值就无法建立卡方分布因为样本均值并非与每个样本独立。 置信区间的计算
对于总体均值的置信区间若总体方差已知就构建正态分布
若总体方差未知就构建T分布
对于总体方差的置信区间无论总体均值是否已知都构建卡方分布来进行求解
若总体均值已知那么分子上的X-均值就是一个一个算
若总体均值未知那么分子上的X-均值就不能一个一个算因为此时总体均值不知道那么就是通过样本方差来解决这一问题即N-1乘以样本方差等于那个不过是自由度减一而且每项减的是样本均值而不是总体均值
在总体方差估计区间中需注意卡方分布是不对称的也就是要查两次表左右都是二分之α的水平 对总体方差估计总体均值未知采用N-1的卡方分布问有无增大所以检验假设为方差70统计量应分布于左侧拒绝域为右侧右侧占0。05 对方差估计均值未知考虑自由度为N-1的卡方分布即(N-1)样本方差除以估计方差左右两侧为α/2的水平 对总体均值估计方差已知采用标准正态注意假设为均值小于等于32然后统计量水平为单侧左侧拒绝域在右侧 对总体均值的估计总体方差不知用自由度-1的T分布左右为二分之α即0.025 对总体均值估计总体方差未知采用自由度N-1的T分布置信度95%分布在左右两侧 对总体方差估计总体均值未知采用N-1的卡方分布分子为N-1*S^2分母为方差左右为α/2 问方差方差估计那就是卡方分布由于均值未知所以依据样本方差构建样本方差乘样本数量-1除以总体方差就是n-1的卡方分布问是否明显变化双侧估计拒绝域就是比1-α/2小或者比α/2大
第一类第二类错误
第一类第二类错误理解
主要是第二类错误的计算
第一类错误是说原假设为真然后放弃原假设即弃真错误第二类错误是说原假设为假接受原假设。一般思路为固定犯第一类错误的概率然后缩小第二类错误的概率。
犯第一类错误的概率就是α固定后就可以确定拒绝域边界的情况。
犯第二类错误原假设为假依然接受那么就是依据第一类错误固定下的边界C可以表达出相应量在的一个区间里即不在拒绝域内然后可以计算在实际分布条件下分布在这个区间里的概率
就是说拒绝域的边界值和第一类错误的概率α水平息息相关互为决定。 变量间转换概率计算题 求积分公式 涉及一维与二维
考虑平方的转化 卷积公式计算 证明题 似然估计练练 理解 密度函数与分布函数的理解
有一个函数它可以取很多值如果取每个值的概率都一样那就是分布均匀的是均匀函数如果分布不均匀就不是均匀函数分布每个值在函数取值出现的概率就是密度函数均匀时都一样不均匀时根据出现的值有其对应的出现概率。
分布函数可以理解为分布函数这个值然后函数取值的点落在这个值划定的左区间内的概率或者可以说是占比
从这个角度密度函数的自变量取值范围就是对应会出现的值然后这个值通过密度函数会得到其出现的概率而分布函数就是立一个区间右端点然后问自变量可能出现的值取值在这个区间里的概率。
二维变量密度函数卷积公式理解
卷积公式就是原来两个变量x,y然后有一个z综合了2个变量的信息通过卷积公式就是把其中一个变量视为常数然后用z去替换掉剩下的那个变量利用的方式就是一维的函数替换求反函数然后乘一个求导注意另一个变量在此时表现为常数之后就得到了把其中一个变量替换后的x,z联合分布以替换y为例然后再对每个z收缩其所有的x即可求得z的单独密度函数。
即替掉哪个变量计为Y时就求Y与Z的关系式Y为因变量把X视为常数然后在函数里踢掉Y为Z然后乘一个YZ关系式中对Z求导的结果可能涉及到X求导时其视为常数最后就收缩所有的X得到Z的式子。
第一步是要得到联合密度函数就是把不同变量X,Y的取值综合在一起的一个密度联式
在一维当中Y与X满足一个关系式Y为因变量X已知分布函数那么转换求反函数得到X为因变量的与Y的关系式然后这个表达式对Y求导取绝对值把X当中的换掉为Y就是Y的分布函数
对于泊松分布与指数分布的区分
泊松分布与指数分布共用一个参数就是朗姆达这个参数的含义就是一定时间内事件发生的次数频率是次数、频率。
相应的等待时间寿命就是频率的倒数。
要根据实际意义确定真正的朗姆达