Articles of pandas

Pandas erro ao usar if-else para criar nova coluna: O valor de verdade de uma série é ambíguo

Estou usando o Pandas e estou tentando criar uma nova coluna usando uma instrução if-else do Python (também conhecida como operador de condição ternária) para evitar a divisão por zero. Por exemplo abaixo, eu quero criar uma nova coluna C dividindo A / B. Eu quero usar a instrução if-else para evitar dividir por 0. […]

python re-sample em um período semestral uniforme (equivalente a ‘BQ’ em pandas resample)

existe uma resample semestral equivalente a ‘BQ’ em python? Eu não encontrei aqui http://pandas.pydata.org/pandas-docs/dev/timeseries.html#up-and-downsampling Eu tenho um conjunto de registros, alguns deles seguem jun-dec, alguns jan-jul, alguns feb-auh etc. como eu reamostrar todos eles para jun-dez (simultaneamente para jun-dez e após jun / dez para outros registros? Obrigado.

Obtendo todos os descendentes de um pai de uma tabela pai pai de dataframe do pandas

Eu tenho um dataframe Pandas contendo ids pai e id filhos. Preciso de ajuda para criar um dataframe atualizado listando cada descendente de cada pai. Para esclarecer como deve ser a saída, aqui está um post em dba.stackexchange usando SQL para realizar o que estou tentando fazer em python. Aqui está um exemplo da input […]

Como comparar duas colunas do mesmo dataframe?

Eu tenho um dataframe assim: match_id inn1 bat bowl runs1 inn2 runs2 is_score_chased 1 1 KKR RCB 222 2 82 1 2 1 CSK KXIP 240 2 207 1 8 1 CSK MI 208 2 202 1 9 1 DC RR 214 2 217 1 33 1 KKR DC 204 2 181 1 Agora, quero […]

Contando Valores Duplicados no DataFrame do Pandas

Deve haver uma maneira fácil de fazer isso, mas não consegui encontrar uma solução elegante para SO ou resolvê-la sozinha. Estou tentando contar o número de valores duplicados com base no conjunto de colunas em um DataFrame. Exemplo: print df Month LSOA code Longitude Latitude Crime type 0 2015-01 E01000916 -0.106453 51.518207 Bicycle theft 1 […]

Pandas: calcula a média de uma coluna agrupada por outra coluna

Digamos que eu tenha um dataframe assim: gender height weight C 2000-01-01 male 42.849980 157.500553 1 2000-01-02 male 49.607315 177.340407 1 2000-01-03 male 56.293531 171.524640 1 2000-01-04 female 48.421077 144.251986 2 2000-01-05 male 46.556882 152.526206 2 2000-01-06 female 68.448851 168.272968 1 2000-01-07 male 70.757698 136.431469 2 2000-01-08 female 58.909500 176.499753 3 2000-01-09 female 76.435631 174.094104 […]

Converter um pandas “Series of pair arrays” para um “DataFrame de duas colunas”?

Eu tenho uma série de pandas que consiste em matrizes de pares: In [177]: pair_arrays Out[177]: 15192 [[1, 9], [2, 14], [4, 1], [5, 36], [6, 8], [7,… 16012 [[0, 107], [1, 42], [2, 22], [3, 59], [4, 117]… 17523 [[0, 44], [1, 36], [2, 43], [3, 28], [4, 52], … … Eu gostaria de […]

Manipulando NA em groupby + transform

Estou tendo problemas em transformar em um grupo em que a coluna usada para agrupamento tem valores NaN. O seguinte código usado para trabalhar até a versão 0.19.1 do pandas . Agora atualizei meu ambiente para a versão 0.20.3 e ele não funciona mais . O código de exemplo: import numpy import pandas df = […]

Python Localizar max na coluna dataframe para fazer um loop para encontrar todos os valores

Então eu tenho um grande dataframe, usando pandas. Quando faço max(df[‘A’]) ele reporta um máximo de 9999 quando deveria ser 396450 por observação. import numpy as numpy import pandas as pd f = open(“20170901.as-rel2.txt”, ‘r’) #read file into array, ignore first 6 lines lines = loadtxt(“20170901.as-rel2.txt”, dtype=’str’, comments=”#”, delimiter=”|”, unpack=False) #ignore col 4 lines=lines[:, :3] […]

Inserir o dataframe do Pandas na tabela Cassandra

A partir da documentação , há uma maneira de inserir dados na tabela: session.execute( “”” INSERT INTO users (name, credits, user_id) VALUES (%s, %s, %s) “””, (“John O’Reilly”, 42, uuid.uuid1()) ) O nome da coluna deve ser indicado lá. No entanto, no meu caso, eu tenho um dataframe que tem apenas uma linha de header […]