Вопросы с тегом 'dplyr'
Используйте этот тег для вопросов, связанных с функциями из пакета dplyr, таких как group_by, суммировать, фильтровать и выбирать.
3
data.table vs dplyr: может ли что-то сделать хорошо, а другое плохо или плохо?
обзор Я относительно знаком с data.table, не так много с dplyr. Я прочитал некоторые виньетки и примеры dplyr на SO, и пока мои выводы таковы: data.table и dplyr сопоставимы по скорости, за исключением случаев, когда существует много (то есть>...
29 янв. '14 в 15:21
4
Просмотреть/распечатать весь текст (tbl_df)?
tibble (ранее tbl_df) - это версия фрейма данных, созданного пакетом манипуляции с фреймами данных dplyr в R. Он предотвращает выходы длинных таблиц при случайном вызове кадра данных.
Как только кадр данных был обернут tibble/tbl_df, есть ли кома...
20 апр. '14 в 23:55
9
Группировать по нескольким столбцам в dplyr, используя ввод векторной строки
Я пытаюсь передать свое понимание plyr в dplyr, но я не могу понять, как группировать по нескольким столбцам.
# make data with weird column names that can't be hard coded
data = data.frame(
asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, rep...
18 янв. '14 в 19:26
9
Фиксирование множественного предупреждения "неизвестный столбец"
У меня есть постоянное многократное предупреждение "неизвестного столбца" для всех типов команд (например, str (x) для установки обновлений пакетов), и не уверен, как отладить это или исправить.
Предупреждение "неизвестный столбец" явно связано с пе...
19 авг. '16 в 14:07
7
Относительные частоты/пропорции с dplyr
Предположим, что я хочу рассчитать долю разных значений в каждой группе. Например, используя данные mtcars, как я могу рассчитать относительную частоту числа передач с помощью am (автоматически/вручную) за один раз с помощью dplyr?
library(dply...
04 июл. '14 в 14:31
5
Может ли пакет dplyr использоваться для условного мутирования?
Могут ли mutate использоваться, если мутация является условной (в зависимости от значений определенных значений столбца)? Этот пример помогает показать, что я имею в виду. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4,
2, 6, 7, 2, 6)...
27 июн. '14 в 19:48
7
mutate: использовать динамические имена переменных
Я хочу использовать dplyr mutate() для создания нескольких новых столбцов в фрейме данных. Имена столбцов и их содержимое должны быть динамически сгенерированы.
Пример данных из диафрагмы:
require(dplyr)
data(iris)
iris <- tbl_df(iris)
Я соз...
23 сент. '14 в 19:51
8
Выберите первую и последнюю строку из сгруппированных данных
Вопрос
Используя dplyr, как я могу выбрать верхние и нижние наблюдения/строки сгруппированных данных в одном выражении?
Данные и пример
С учетом кадра данных
df <- data.frame(id=c(1,1,1,2,2,2,3,3,3),
stopId=c("a","b","c",...
21 июл. '15 в 1:41
7
Замена для "переименования" в dplyr
Мне нравится функция переименования plyr rename. Я недавно начал использовать dplyr и задавался вопросом, есть ли простой способ переименовать переменные, используя функцию из dplyr, которая так же проста в использовании, как и plyr rename?
01 февр. '14 в 19:25
6
Удаление дублированных строк с помощью dplyr
У меня есть data.frame, как это -
set.seed(123)
df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10)
> df
x y z
1 0 1 1
2 1 0 2
3 0 1 3
4 1 1 4
5 1 0 5
6 0 1 6
7 1 0 7
8 1 0 8
9 1 0 9
10 0 1 10
Я х...
09 апр. '14 в 10:22
6
Применение функции к каждой строке таблицы с помощью dplyr?
При работе с plyr мне часто было полезно использовать adply для скалярных функций, которые я должен применять к каждой строке.
например.
data(iris)
library(plyr)
head(
adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length))
)
...
16 февр. '14 в 23:21
5
Суммируя несколько столбцов с dplyr?
Я немного борюсь с dplyr-синтаксисом. У меня есть кадр данных с разными переменными и одна переменная группировки. Теперь я хочу рассчитать среднее значение для каждого столбца в каждой группе, используя dplyr в R.
df <- data.frame(a=sample(1:5, ...
08 февр. '14 в 10:27
5
Соберите несколько наборов столбцов
У меня есть данные из онлайн-опроса, где респонденты проходят цикл вопросов 1-3 раза. Программное обеспечение опроса (Qualtrics) записывает эти данные в несколько столбцов, то есть Q3.2 в опросе будет иметь столбцы Q3.2.1., Q3.2.2. и Q3.2.3.:
df &l...
19 сент. '14 в 2:41
4
dplyr суммировать: Эквивалент ".drop = FALSE" для сохранения групп с нулевой длиной в выходе
При использовании summarise с функцией plyr ddply пустые категории по умолчанию отбрасываются. Вы можете изменить это поведение, добавив .drop = FALSE. Однако при использовании summarise с dplyr это не работает. Есть ли другой способ сохранить пусты...
20 мар. '14 в 3:52
1
R, распространяющих несколько столбцов с тидиром
Возьмите эту переменную образца
df <- data.frame(month=rep(1:3,2),
student=rep(c("Amy", "Bob"), each=3),
A=c(9, 7, 6, 8, 6, 9),
B=c(6, 7, 8, 5, 6, 7))
Я могу использовать spread из tidyr, чтоб...
02 июн. '15 в 9:22