Вопросы с тегом 'pandas-groupby'
Используется для группировки переменных вместе на основе данного условия. И только для использования с библиотекой `pandas`
9
Преобразование вывода Pandas GroupBy из Series в DataFrame
Я начинаю с входных данных, подобных этому
df1 = pandas.DataFrame( {
"Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] ,
"City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } )
Что при печати вы...
29 апр. '12 в 16:10
5
Получить статистику для каждой группы (например, количество, среднее и т.д.), Используя pandas GroupBy?
У меня есть фрейм данных df и я использую несколько столбцов из него для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean()
Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это до...
15 окт. '13 в 15:00
2
Как повернуть рамку данных
Что такое пивот? Как мне повернуть? Это стержень? Длинный формат для широкого формата? Я видел много вопросов о сводных таблицах. Даже если они не знают, что спрашивают о сводных таблицах, они обычно так и делают. Практически невозможно написать ...
07 нояб. '17 в 8:00
9
группировка строк в списке в pandas groupby
У меня есть фрейма данных панд, как: a b
A 1
A 2
B 5
B 5
B 4
C 6
Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках: A [1,2]
B [5,5,4]
C [6]
Можно ли сделать что-то подобное с помощью групповых панд?
06 мар. '14 в 8:31
11
Получить строки, которые имеют максимальное значение в группах, используя groupby
Как найти все строки в кадре данных Pandas, которые имеют максимальное значение для столбца count, после группировки по столбцам ['Sp','Mt']? Пример 1: следующий dataFrame, который я группирую по ['Sp','Mt']: Sp Mt Value count
0 MM1 S1 a...
29 мар. '13 в 14:48
3
Несколько агрегатов одного столбца с использованием pandas GroupBy.agg()
Учитывая следующий (полностью перебитый) пример фрейма данных import pandas as pd
import datetime as dt
df = pd.DataFrame({
"date" : [dt.date(2012, x, 1) for x in range(1, 11)],
"returns" : 0.05 * np.random.randn(10),
...
25 сент. '12 в 19:05
4
pandas группа данных данных по дате месяца
Рассмотрим файл csv:
string,date,number
a string,2/5/11 9:16am,1.0
a string,3/5/11 10:44pm,2.0
a string,4/22/11 12:07pm,3.0
a string,4/22/11 12:10pm,4.0
a string,4/29/11 11:59am,1.0
a string,5/2/11 1:41pm,2.0
a string,5/2/11 2:02pm,3.0
a string,5/2/...
06 июн. '14 в 13:15
9
GroupBy панды DataFrame и выберите наиболее распространенное значение
У меня есть кадр данных с тремя строковыми столбцами. Я знаю, что единственное значение в третьем столбце допустимо для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать по кадру данных первые два столбца и выбрать наиболе...
05 мар. '13 в 11:34
4
Сохраняйте другие столбцы при групповом
Я использую groupby на фрейме данных pandas для удаления всех строк, у которых нет минимума определенного столбца. Примерно так:
df1 = df.groupby("item", as_index=False)["diff"].min()
Однако, если у меня больше этих двух столбцов, другие столбцы (...
30 апр. '14 в 17:29
2
Как мне создать новый столбец из вывода pandas groupby(). Sum()?
Попытка создать новый столбец из groupby расчета. В приведенном ниже коде я получаю правильные рассчитанные значения для каждой даты (см. Группу ниже), но когда я пытаюсь создать новый столбец (df['Data4']), я получаю NaN. Поэтому я пытаюсь создать ...
14 мая '15 в 18:44
3
Метод Pandas GroupBy.apply дублирует первую группу
Мой первый вопрос SO:
Я смущен этим поведением метода groupby в pandas (0.12.0-4), он, как представляется, применяет функцию TWICE к первой строке кадра данных. Например:
>>> from pandas import Series, DataFrame
>>> import pandas ...
27 янв. '14 в 19:37
4
Python - функции качения для объекта GroupBy
У меня есть объект временного ряда grouped типа <pandas.core.groupby.SeriesGroupBy object at 0x03F1A9F0>. grouped.sum() дает желаемый результат, но я не могу заставить rol_sum работать с объектом groupby. Есть ли способ применить функции качен...
21 дек. '12 в 19:49
2
Как получить число групп в объекте groupby в pandas?
Это было бы полезно, поэтому я знаю, сколько уникальных групп я должен выполнять вычисления. Спасибо.
Предположим, что объект groupby называется dfgroup.
05 янв. '15 в 21:08
2
Что такое эквивалент панды dplyr суммировать/агрегировать по нескольким функциям?
У меня возникли проблемы при переходе на панды из R, где пакет dplyr может легко группироваться и выполнять несколько обобщений. Пожалуйста, помогите улучшить мой существующий код Python для нескольких агрегатов: import pandas as pd
data = pd.DataF...
13 авг. '16 в 18:03
4
группы pandas и выберите последний в каждой группе
Как группировать значения pandas данных и выбирать последние (по дате) из каждой группы?
Например, для данных, отсортированных по дате:
id product date
0 220 6647 2014-09-01
1 220 6647 2014-09-03
2 220 6647 2...
07 янв. '17 в 20:03