close

本篇紀錄了一些曾經使用pandas(之後簡稱pd)處理excel所遇到的問題,將其記錄下來

1.讀取excel並存成dataframe(之後簡稱為df )___pd.read_excel
2.從df中取值 ___df.iloc
3.合併兩個dataframe ___pd.merge
4.刪除某一欄___del df['column name']
5.改變某一欄的名稱___df.columns.values
6.依照某columnName排序__
7.判斷dataframe中的nan值

 

 


1.讀取excel並存成dataframe

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds )

先import pandas
import pandas as pd

接著就可以直接讀取
read = pd.read_excel("存放路徑")

若excel已經存放於當前py檔的資料夾

就可以直接呼叫 os.getcwd() 的方法取得當前位置,但要import os才可以使用


2.從df中取值

讀取後,其type為Dataframe的形式

如果想要取其中的值

可以直切呼叫 .iloc()的方法

例如:read.iloc[ 0 , : ] 即取出第1列的所有值


3.合併兩個dataframe

如果想要將兩個excel合併為一個dataframe

合併的方式為上下

則可以使用 pd.merge()方法

假設現在已經有兩個df為a與b

若 a = [ 1 2 3 ], b = [ 4 5 6 ] , 想合併為 [ [1 2 3], [4 5 6] ]

則使用 pd.merge(a,b,how='outer')

更多合併df的問題,可以參考下面這篇文章。

http://blog.csdn.net/zutsoft/article/details/51498026


4.刪除某一欄

直接使用 del 刪除(這裡其實沒甚麼好說的XD)


5.改變某一欄的名稱

df.columns.values[ i ]='new cloumn name'

更改第 i 個欄位的名稱為 new cloumn name


6.依照某columnName排序

https://ithelp.ithome.com.tw/articles/10185922
https://oranwind.org/python-pandas-ji-chu-jiao-xue/
https://www.zybuluo.com/jk88876594/note/804538


7.判斷dataframe中的nan值

判斷df中的nan值 : df.isnull()

得到df中的nan數量 : df.isnull().sum()

https://stackoverflow.com/questions/29530232/python-pandas-check-if-any-value-is-nan-in-dataframe


 

arrow
arrow
    全站熱搜

    魚大 發表在 痞客邦 留言(0) 人氣()