Python pandas extraer valores únicos de una columna y otra columna

votos
0

Estoy estudiando pandas, etc. bokeh para empezar con datos vizualisation. En este momento estoy practicando con una mesa gigante que contiene diferentes aves. Hay un montón de columnas; dos de esas columnas son NOMBRE CIENTÍFICO y otra es RECUENTO DE OBSERVACIÓN. Quiero extraer esas dos columnas.

yo hice

df2 = df[[SCIENTIFIC NAME , OBSERVATION COUNT]]

pero el problema es, pues, que cada entrada está dentro de la mesa (ya que a veces hay varias entradas / filas debido a otras columnas del mismo nombre científico, pero el recuento de observación es siempre el mismo para el nombre científico)

¿Cómo puedo conseguir esos dos sectores, pero con los valores únicos, por lo que cada nombre científico de una vez, con el recuento de observación corresonding.

EDIT: Me acabo de dar cuenta que a veces los mismos nombres científicos tienen diferentes cantidades de observación debidos a otra columna. ¿Hay una manera de extraer cada primer artículo único de una columna

Publicado el 09/10/2019 a las 18:49
fuente por usuario
En otros idiomas...                            


1 respuestas

votos
1

IIUC, puede utilizar drop_duplicates:

df2 = df[["SCIENTIFIC NAME" , "OBSERVATION COUNT"]].drop_duplicates()

Para obtener el recuento:

df2 = df.groupby(["SCIENTIFIC NAME" , "OBSERVATION COUNT"])["SCIENTIFIC NAME"].count()
Respondida el 09/10/2019 a las 18:52
fuente por usuario

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more