Mysql
 sql >> Base de données >  >> RDS >> Mysql

Comment grouper par et prendre le nombre d'une colonne divisé par le nombre d'uniques de la deuxième colonne de la trame de données dans les pandas python?

Il semble que vous ayez besoin de aggregate par size et nunique puis div colonnes de sortie :

df = pd.DataFrame({'col1':[1,1,1],
                   'col2':[4,4,6],
                   'col3':[7,7,9],
                   'col4':[3,3,5]})

print (df)
   col1  col2  col3  col4
0     1     4     7     3
1     1     4     7     3
2     1     6     9     5

df1 = df.groupby(['col1','col2']).agg({'col3':'size','col4':'nunique'})
df1['result_col'] = df1['col3'].div(df1['col4'])
print (df1)
           col4  col3  result_col
col1 col2                        
1    4        1     2         2.0
     6        1     1         1.0