반응형

dataframe 3

판다에서 개체별로 한 그룹에 속한 그룹의 수를 구하는 방법은?

판다에서 개체별로 한 그룹에 속한 그룹의 수를 구하는 방법은? 이것은 유용할 것입니다. 그래서 저는 제가 몇 개의 독특한 그룹에 대해 계산을 수행해야 하는지 알 수 있습니다.감사해요. 개체별 그룹을 다음과 같이 가정합니다.dfgroup.심플하고 빠르고 팬더식:ngroups API별 그룹의 최신 버전(pandas > = 0.23)은 GroupBy 개체의 그룹 수를 저장하는 이(문서화되지 않은) 특성을 제공합니다. # setup df = pd.DataFrame({'A': list('aabbcccd')}) dfg = df.groupby('A') # call `.ngroups` on the GroupBy object dfg.ngroups # 4 이것은 실제 그룹 자체를 반환하는 것과는 다릅니다. 내가 왜 이것보..

programing 2023.10.30

ix 또는 iloc을 사용하여 panda DataFrame에서 특정 값(셀 내)이 NaN인지 확인

ix 또는 iloc을 사용하여 panda DataFrame에서 특정 값(셀 내)이 NaN인지 확인 내게 다음이 있다고 치자.pandas DataFrame: import pandas as pd df = pd.DataFrame({"A":[1,pd.np.nan,2], "B":[5,6,0]}) 다음과 같이 보입니다. >>> df A B 0 1.0 5 1 NaN 6 2 2.0 0 첫번째 옵션 특정 값이 다음 값인지 확인할 수 있는 한 가지 방법을 알고 있습니다.NaN, 다음과 같습니다. >>> df.isnull().ix[1,0] True 두 번째 옵션(작동하지 않음) 나는 아래 옵션을 생각했다, 사용.ix, 효과는 있겠지만 그렇지는 않습니다. >>> df.ix[1,0]==pd.np.nan False 저도 노력했습..

programing 2023.10.30

df.drop이 있는 경우

df.drop이 있는 경우 아래는 파일을 가져와서 열 이름을 드롭하는 함수입니다.row_num,start_date,end_date. 문제는 모든 파일에 이러한 각 열 이름이 있는 것은 아니므로 함수가 오류를 반환한다는 것입니다. 제 목표는 이러한 열이 존재하면 제거하고 특정 열이 존재하지 않으면 오류를 반환하지 않도록 코드를 변경하는 것입니다. def read_df(file): df = pd.read_csv(file, na_values=['', ' ']) # Drop useless junk and fill empty values with zero df = df.drop(['row_num','start_date','end_date','symbol'], axis=1).fillna(0) df=df[df!=0]..

programing 2023.09.25
반응형