hello大家好,我是城鄉(xiāng)經(jīng)濟(jì)網(wǎng)小晟來為大家解答以上問題,correlation相關(guān)性如何計算,相關(guān)系數(shù)Correlation很多人還不知道,現(xiàn)在讓我們一起來看看吧!
(相關(guān)資料圖)
通常指Pearson product-moment correlation coefficient,統(tǒng)計學(xué)參數(shù),用來研究變量間的相關(guān)性,通常描述變量間的線性相關(guān)性。其范圍介于-1和1之間,其絕對值越接近1,說明變量間的相關(guān)性越大。
相關(guān)系數(shù)r的范圍
Pearson相關(guān)系數(shù)的計算公式如下:
Pearson相關(guān)系數(shù)計算公式
該公式將變量x和y的協(xié)方差與變量x和y的方差積的根號值的比值作為新的參數(shù)來衡量變量x和y之間相關(guān)性。Pearson相關(guān)系數(shù)的好處在于歸一化了系數(shù)的范圍,不用考慮量綱值對參數(shù)評價的影響,但是該系數(shù)有一定的局限性,并不能完全描述所有變量的相關(guān)性。除此之外描述變量相關(guān)性的系數(shù)還有Spearman correlation coefficient(斯皮爾曼相關(guān)性系數(shù))和Kendall(肯德爾相關(guān)性系數(shù))系數(shù)。Spearman系數(shù)用于描述具有順序?qū)傩缘淖兞啃蛄?,而Kendall序列用于描述具有類別屬性的變量。
明確了這些系數(shù)之后,重點(diǎn)在于如何計算這些系數(shù)??梢酝ㄟ^一些統(tǒng)計分析軟件,去計算這些系數(shù),常用的有Origin和Spss等。此外也可以使用python和Matlab的庫函數(shù)很容易求得這些變量之間的相關(guān)系數(shù)。以O(shè)rigin為例:
我們首先可以導(dǎo)入需要分析的變量值到一個工作簿中,然后進(jìn)入Origin統(tǒng)計菜單,然后點(diǎn)擊相關(guān)系數(shù)進(jìn)入相關(guān)系數(shù)頁面
在相關(guān)系數(shù)頁面,我們可以選擇要選取變量的范圍,指定需要計算那些相關(guān)性系數(shù),同時可以將變量繪制成散點(diǎn)圖便于可視化分析。
通過計算可得變量A和變量B之間是高度相關(guān)的,其相關(guān)系數(shù)值高達(dá)0.99。
Origin計算相關(guān)系數(shù)
通過使用Python的pandas庫我們可以很容易對相應(yīng)的變量執(zhí)行相關(guān)系數(shù)計算,通過計算可以求得變量1和變量2之間的相關(guān)系數(shù)為0.99461,這和Origin計算得到的結(jié)果一致。此外還可以在corr函數(shù)內(nèi)設(shè)置相關(guān)系數(shù)的計算類別,進(jìn)一步執(zhí)行Spearman系數(shù)和Kendall系數(shù)計算。使用Python的好處是可以方便快捷去執(zhí)行批量化的相關(guān)系數(shù)計算。
使用python計算相關(guān)系數(shù)
本文就為大家講解到這里,希望對大家有所幫助。
營業(yè)執(zhí)照公示信息