close

在處理資料時,總會有缺失的資料
若使用 pandas.read_excel( ) 讀取的資料裡有nan值
nan 其實就是 not a number 的意思,亦即 float('nan')
所以nan是一個float,因此也可以被計算

 

假設現在有一串數列
data = pd.Series( [1,2,float('nan'),4,float('nan'),5] )
data_notnull = data[ data.notnull() ]   # 結果data_notnull = [1,2,4,5]
data_dropna = data.dropna()   # 結果data_dropna  = [1,2,4,5]  ,結果同 data_notnull
data_fillna = data.fillna(0)   # 結果 data_fillna = [1,2,0,4,0,5]
data[ data.isnull() ] = 0   #結果 data = [1,2,0,4,0,5],結果同data_fillna

<補充> data.isnull() 以及 data.notnull() 回傳的都會是index

arrow
arrow
    文章標籤
    python nan pandas numpy
    全站熱搜
    創作者介紹
    創作者 魚大 的頭像
    魚大

    魚大-程式筆記

    魚大 發表在 痞客邦 留言(0) 人氣()