導入模塊
1.讀取測試數據
2.查看數據
3.篩選差異基因
4.查看數據,發現多了type這一列
5.統計個數
6.繪火山圖
7.保存圖片
導入模塊import numpy as npimport pandas as pd
1.讀取測試數據data=pd.read_csv(r'E:\ZYH\R.project\rna-seq\lianxi1\exon_level\df.csv')
2.查看數據data.head()
3.篩選差異基因# 3.嘗試寫循環篩選上下調基因分類賦值給 "up" 和 "down" 和 "nosig" 加入pvalue條件###loc函數:通過行索引 "Index" 中的具體值來取行數據(如取"Index"為"A"的行)data.loc[(data.log2FoldChange>1)&(data.padj<0.05),'type']='up'data.loc[(data.log2FoldChange<-1)&(data.padj<0.05),'type']='down'data.loc[(abs(data.log2FoldChange)<=1)|(data.padj>=0.05),'type']='nosig'
4.查看數據,發現多了type這一列data.head()
5.統計個數data.type.value_counts()up 123down 103Name: type, dtype: int64
6.繪火山圖import seaborn as snsimport mathimport matplotlib.pyplot as pltimport matplotlib as mpl%matplotlib inline# 對padj取個-log10對數data['-logpadj']=-data.padj.apply(math.log10)# 查看data[['log2FoldChange','padj','type','-logpadj']].head()
# 先設置一下自己的顏色colors = ["#01c5c4","#ff414d", "#686d76"]sns.set_palette(sns.color_palette(colors))# 繪圖ax=sns.scatterplot(x='log2FoldChange', y='-logpadj',data=data, hue='type',#顏色映射 edgecolor = None,#點邊界顏色 s=8,#點大小 )# 標簽ax.set_title("vocalno")ax.set_xlabel("log2FC")ax.set_ylabel("-log10(padj)")#移動圖例位置ax.legend(loc='center right', bbox_to_anchor=(0.95,0.76), ncol=1)
7.保存圖片fig = ax.get_figure()fig.savefig('./python_vocalno.pdf')
以上就是python數據可視化繪制火山圖示例的詳細內容,更多關於python數據可視化火山圖的資料請關注軟件開發網其它相關文章!