皮爾遜pearson相關系數和斯皮爾曼spearman等級相關系數。
它們可用來衡量兩個變量之間的相關性的大小
1. 總體:所要考察對象的全部個體叫做總體
(我國10年進行一次的人口普查得到的數據就是總體數據)
2. 樣本:從總體中所抽取的一部分個體叫做總體的一個樣本
(在QQ群發問卷叫同學幫忙填寫得到的數據就是樣本數據)
import pandas as pd
data = pd.read_excel('八年級女生體測數據.xlsx')
data.corr() # 計算相關性系數
運行結果:
## 相關性系數熱力圖
import seaborn as sns
import matplotlib.pyplot as plt
corr = data.corr()
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] =False #減號unicode編碼
ax = plt.subplots(figsize=(20, 16))#調整畫布大小
ax = sns.heatmap(corr, vmax=.8, square=True, annot=True)#畫熱力圖 annot=True 表示顯示系數
# 設置刻度字體大小
plt.xticks(fontsize=13)
plt.yticks(fontsize=13)
運行結果: