Вопросы с тегом 'pandas-groupby'

Используется для группировки переменных вместе на основе данного условия. И только для использования с библиотекой `pandas`
9

Преобразование вывода Pandas GroupBy из Series в DataFrame

Я начинаю с входных данных, подобных этому df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Что при печати вы...
29 апр. '12 в 16:10
5

Получить статистику для каждой группы (например, количество, среднее и т.д.), Используя pandas GroupBy?

У меня есть фрейм данных df и я использую несколько столбцов из него для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это до...
15 окт. '13 в 15:00
2

Как повернуть рамку данных

Что такое пивот? Как мне повернуть? Это стержень? Длинный формат для широкого формата? Я видел много вопросов о сводных таблицах. Даже если они не знают, что спрашивают о сводных таблицах, они обычно так и делают. Практически невозможно написать ...
07 нояб. '17 в 8:00
9

группировка строк в списке в pandas groupby

У меня есть фрейма данных панд, как: a b A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках: A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное с помощью групповых панд?
06 мар. '14 в 8:31
11

Получить строки, которые имеют максимальное значение в группах, используя groupby

Как найти все строки в кадре данных Pandas, которые имеют максимальное значение для столбца count, после группировки по столбцам ['Sp','Mt']? Пример 1: следующий dataFrame, который я группирую по ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a...
29 мар. '13 в 14:48
3

Несколько агрегатов одного столбца с использованием pandas GroupBy.agg()

Учитывая следующий (полностью перебитый) пример фрейма данных import pandas as pd import datetime as dt df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), ...
25 сент. '12 в 19:05
4

pandas группа данных данных по дате месяца

Рассмотрим файл csv: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/...
06 июн. '14 в 13:15
9

GroupBy панды DataFrame и выберите наиболее распространенное значение

У меня есть кадр данных с тремя строковыми столбцами. Я знаю, что единственное значение в третьем столбце допустимо для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать по кадру данных первые два столбца и выбрать наиболе...
05 мар. '13 в 11:34
4

Сохраняйте другие столбцы при групповом

Я использую groupby на фрейме данных pandas для удаления всех строк, у которых нет минимума определенного столбца. Примерно так: df1 = df.groupby("item", as_index=False)["diff"].min() Однако, если у меня больше этих двух столбцов, другие столбцы (...
30 апр. '14 в 17:29
2

Как мне создать новый столбец из вывода pandas groupby(). Sum()?

Попытка создать новый столбец из groupby расчета. В приведенном ниже коде я получаю правильные рассчитанные значения для каждой даты (см. Группу ниже), но когда я пытаюсь создать новый столбец (df['Data4']), я получаю NaN. Поэтому я пытаюсь создать ...
14 мая '15 в 18:44
3

Метод Pandas GroupBy.apply дублирует первую группу

Мой первый вопрос SO: Я смущен этим поведением метода groupby в pandas (0.12.0-4), он, как представляется, применяет функцию TWICE к первой строке кадра данных. Например: >>> from pandas import Series, DataFrame >>> import pandas ...
27 янв. '14 в 19:37
4

Python - функции качения для объекта GroupBy

У меня есть объект временного ряда grouped типа <pandas.core.groupby.SeriesGroupBy object at 0x03F1A9F0>. grouped.sum() дает желаемый результат, но я не могу заставить rol_sum работать с объектом groupby. Есть ли способ применить функции качен...
21 дек. '12 в 19:49
2

Как получить число групп в объекте groupby в pandas?

Это было бы полезно, поэтому я знаю, сколько уникальных групп я должен выполнять вычисления. Спасибо. Предположим, что объект groupby называется dfgroup.
05 янв. '15 в 21:08
2

Что такое эквивалент панды dplyr суммировать/агрегировать по нескольким функциям?

У меня возникли проблемы при переходе на панды из R, где пакет dplyr может легко группироваться и выполнять несколько обобщений. Пожалуйста, помогите улучшить мой существующий код Python для нескольких агрегатов: import pandas as pd data = pd.DataF...
13 авг. '16 в 18:03
4

группы pandas и выберите последний в каждой группе

Как группировать значения pandas данных и выбирать последние (по дате) из каждой группы? Например, для данных, отсортированных по дате: id product date 0 220 6647 2014-09-01 1 220 6647 2014-09-03 2 220 6647 2...
07 янв. '17 в 20:03