協(xié)方差是指(協(xié)方差函數(shù)是干什么的)
來(lái)源:好上學(xué) ??時(shí)間:2022-08-18
離均差、方差、均方差、協(xié)方差這幾個(gè)數(shù)學(xué)名詞都聽(tīng)上去都差不多,可是在日常工作生活中能用得上這些概念的人應(yīng)該不多,今天就來(lái)說(shuō)說(shuō)其中的差別。
要想搞清楚什么是離均差、方差、均方差和協(xié)方差,得先從均值這個(gè)概念開(kāi)始。哪怕是數(shù)學(xué)再不好的人,也應(yīng)該知道算術(shù)平均數(shù)是怎么回事吧。
以標(biāo)準(zhǔn)普爾500指數(shù)為例,在2018年9月10日至9月21日期間共有10個(gè)交易日,自然也就有10個(gè)標(biāo)準(zhǔn)普爾500指數(shù)的收盤(pán)價(jià)。將這10個(gè)交易日的標(biāo)準(zhǔn)普爾500指數(shù)收盤(pán)價(jià)相加后除以交易天數(shù)10,就會(huì)得出這10個(gè)交易日標(biāo)準(zhǔn)普爾500指數(shù)收盤(pán)價(jià)的均值2,902.46。
日期 | 標(biāo)準(zhǔn)普爾500指數(shù)X | 均值 |
2018-9-10 | 2,877.13 | 2,902.46 |
2018-9-11 | 2,887.89 | |
2018-9-12 | 2,888.92 | |
2018-9-13 | 2,904.18 | |
2018-9-14 | 2,904.98 | |
2018-9-17 | 2,888.80 | |
2018-9-18 | 2,904.31 | |
2018-9-19 | 2,907.95 | |
2018-9-20 | 2,930.75 | |
2018-9-21 | 2,929.67 | |
合計(jì) | 29,024.58 |
有了均值,下面就可以計(jì)算離均差,離均差就是一組數(shù)據(jù)中各個(gè)數(shù)值與該組數(shù)據(jù)均值的差異。用上述10個(gè)交易日的收盤(pán)價(jià)分別減去均值2,902.46,可以得出每一個(gè)收盤(pán)價(jià)的離均差。
日期 | 標(biāo)準(zhǔn)普爾500指數(shù)X | 均值M | 離均差=X-M |
2018-9-10 | 2,877.13 | 2,902.46 | (25.33) |
2018-9-11 | 2,887.89 | (14.57) | |
2018-9-12 | 2,888.92 | (13.54) | |
2018-9-13 | 2,904.18 | 1.72 | |
2018-9-14 | 2,904.98 | 2.52 | |
2018-9-17 | 2,888.80 | (13.66) | |
2018-9-18 | 2,904.31 | 1.85 | |
2018-9-19 | 2,907.95 | 5.49 | |
2018-9-20 | 2,930.75 | 28.29 | |
2018-9-21 | 2,929.67 | 27.21 |
離均差是計(jì)算方差的基礎(chǔ),將離均差乘方,相加求和后再除以10求平均值,得出來(lái)的結(jié)果就是這組數(shù)據(jù)的方差,方差衡量的也是一組數(shù)據(jù)中各個(gè)數(shù)值與該組數(shù)據(jù)均值的離散程度。在下表中,方差等于280.7405。方差的計(jì)算公式為
,其中x為樣本平均值,n為樣本的大小。
日期 | 標(biāo)準(zhǔn)普爾500指數(shù)X | 均值M | 離均差 | (離均差)^2=σ2 |
2018-9-10 | 2,877.13 | 2,902.46 | (25.33) | 641.51 |
2018-9-11 | 2,887.89 | (14.57) | 212.23 | |
2018-9-12 | 2,888.92 | (13.54) | 183.28 | |
2018-9-13 | 2,904.18 | 1.72 | 2.97 | |
2018-9-14 | 2,904.98 | 2.52 | 6.36 | |
2018-9-17 | 2,888.80 | (13.66) | 186.54 | |
2018-9-18 | 2,904.31 | 1.85 | 3.43 | |
2018-9-19 | 2,907.95 | 5.49 | 30.16 | |
2018-9-20 | 2,930.75 | 28.29 | 800.44 | |
2018-9-21 | 2,929.67 | 27.21 | 740.49 | |
合計(jì) | 29,024.58 | 2,807.4055 | ||
280.7405 |
有了方差,標(biāo)準(zhǔn)差就迎刃而解了,因?yàn)闃?biāo)準(zhǔn)差=方差的平方根,用σ表示。因此,前面這組數(shù)據(jù)的標(biāo)準(zhǔn)差=(280.7405)^(1/2)=16.7553。
且慢。。。以上的計(jì)算過(guò)程是基于該組數(shù)據(jù)是樣本數(shù)據(jù)的總體這一前提假設(shè),也就是說(shuō)在標(biāo)準(zhǔn)普爾500指數(shù)的歷史上只有2018年9月10日至9月21日這10個(gè)交易日的收盤(pán)價(jià)。當(dāng)然這是不可能,因?yàn)檫@些數(shù)據(jù)只是抽樣數(shù)據(jù),是為了舉例說(shuō)明而給定的樣本數(shù)據(jù)而不是數(shù)據(jù)的全部,因此需要對(duì)以上計(jì)算過(guò)程略作調(diào)整。上表中的和2,807.4055應(yīng)除以(10-1)而不是10,方差的結(jié)果變成311.9339,同樣標(biāo)準(zhǔn)差也就變成=(311.9339)^(1/2)=17.6617:
標(biāo)準(zhǔn)差又名均方差,是離均差平方的算術(shù)平均數(shù)的平方根,可用來(lái)衡量一組數(shù)據(jù)中各個(gè)數(shù)值與該組數(shù)據(jù)均值的離散程度。標(biāo)準(zhǔn)差的計(jì)算公式為
,其中x為樣本平均值,n為樣本的大小。標(biāo)準(zhǔn)差越大,說(shuō)明該組數(shù)據(jù)中大部分?jǐn)?shù)據(jù)與均值的差異較大。均值相等的兩組數(shù)據(jù),標(biāo)準(zhǔn)差卻未必相同。比如,有A、B兩組數(shù)據(jù),如下表所示,這兩組數(shù)據(jù)的均值都等于5。
A | B |
3 | 4.8 |
5 | 5.2 |
4 | 4.3 |
6 | 5.7 |
7 | 5 |
但各數(shù)據(jù)偏離均值的程度是有差異的。。。,可以看到均值相等的兩組數(shù)據(jù)中,A組中各個(gè)數(shù)據(jù)之間的差異程度要高于B組。
小結(jié)一下:方差是標(biāo)準(zhǔn)差的平方,是離均差平方的和的均值。
通過(guò)以上的演示計(jì)算,可以看到離均差、方差、標(biāo)準(zhǔn)差衡量的都是某一組數(shù)據(jù)內(nèi)部各數(shù)值偏離均值的程度,通俗地講是自己跟自己比。但下面介紹的協(xié)方差比較的是兩組數(shù)據(jù)之間的差異程度。協(xié)方差的計(jì)算公式為其中
是兩個(gè)數(shù)據(jù)系列的樣本平均值,x、y為數(shù)據(jù)系列中的單個(gè)數(shù)據(jù),n為樣本的大小。
如果用于比較的兩組數(shù)據(jù)完全相同,那么其方差和協(xié)方差的計(jì)算結(jié)果是一致的,因此方差只是協(xié)方差的一個(gè)特例。
有了方差和協(xié)方差,下一步就可以計(jì)算相關(guān)系數(shù)了,公式為
其中是兩個(gè)數(shù)據(jù)系列的樣本平均值,x、y為數(shù)據(jù)系列中的單個(gè)數(shù)據(jù),n為樣本的大小。
需要注意,如果用協(xié)方差計(jì)算相關(guān)系數(shù),協(xié)方差中的x、y假設(shè)為全體數(shù)據(jù),因此協(xié)方差公式中的標(biāo)準(zhǔn)差計(jì)算時(shí),需要除以n而不是n-1。
以西德克薩斯輕質(zhì)原油和標(biāo)準(zhǔn)普爾500指數(shù)為例,計(jì)算其收益率之間的相關(guān)系數(shù),收盤(pán)價(jià)取值日期為2018年9月10日至9月21日。
分布推導(dǎo)的結(jié)果與EXCEL自帶函數(shù)計(jì)算結(jié)果相符。