Вопросы с тегом 'data.table'

Пакет данных R.table является расширением data.frame, созданным для быстрого анализа данных в памяти. Используйте тег dt для пакета DataTables с помощью Shiny (DT).
8

Чистка значений `Inf` из фрейма данных R

В R у меня есть операция, которая создает некоторые значения Inf, когда я преобразую dataframe. Я хотел бы превратить эти значения Inf в значения NA. Код, который у меня есть, медленный для больших данных, есть ли более быстрый способ сделать это?...
30 авг. '12 в 0:58
5

Какой самый быстрый способ объединить/объединить data.frames в R?

Например (не уверен, что, например, самый представительный пример): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Это то, что у меня есть до сих пор: d <- merge(d1,d2) # 7.6 sec li...
01 дек. '10 в 7:47
2

Какова цель установки ключа в data.table?

Я использую data.table, и есть много функций, которые требуют от меня установить ключ (например, X[Y]). Таким образом, я хочу понять, что делает ключ, чтобы правильно устанавливать ключи в моих таблицах данных. Один источник, который я прочитал, бы...
18 нояб. '13 в 2:56
2

Как изменить порядок столбцов data.table(без копирования)

Я хотел бы изменить порядок столбцов в моем data.table x, учитывая вектор символа имен столбцов, neworder: library(data.table) x <- data.table(a = 1:3, b = 3:1, c = runif(3)) neworder <- c("c", "b", "a") Очевидно, я мог бы сделать: x[ , ne...
01 сент. '12 в 22:47
1

Когда я должен использовать оператор: = в data.table?

Объекты data.table теперь имеют оператор: =. Что делает этот оператор отличным от всех других операторов присваивания? Кроме того, каково его использование, насколько оно быстрее, и когда его следует избегать?
11 авг. '11 в 17:01
9

Как заменить значения NA в таблице для выбранных столбцов

Есть много сообщений о замене значений NA. Я знаю, что можно заменить NA в следующей таблице/фрейме следующим образом: x[is.na(x)]<-0 Но что, если я хочу ограничить его только определенными столбцами? Позвольте мне показать вам пример. Сначала...
15 окт. '13 в 10:36
2

Использование пакета data.table внутри моего собственного пакета

Я пытаюсь использовать пакет data.table внутри своего собственного пакета. MWE выглядит следующим образом: Я создаю функцию test.fun, которая просто создает небольшой объект data.table, а затем суммирует группировку столбцов "Val" столбцом "A". Код ...
10 мая '12 в 3:18
1

Что вы можете сделать с data.frame, что вы не можете с data.table?

Я только начал использовать R и наткнулся на data.table. Я нашел его блестящим. Очень наивный вопрос: могу ли я игнорировать data.frame для использования data.table, чтобы избежать путаницы синтаксиса между двумя пакетами?
29 нояб. '12 в 3:46
8

Используйте значение из предыдущей строки в расчете R.table.table

Я хочу создать новый столбец в таблице данных, рассчитанный из текущего значения одного столбца и предыдущего. Возможно ли доступ к предыдущим строкам? например:. > DT <- data.table(A=1:5, B=1:5*10, C=1:5*100) > DT A B C 1: 1 10 100 ...
04 февр. '13 в 14:59
2

Может ли dplyr суммировать несколько переменных без перечисления каждого из них?

dplyr удивительно быстрый, но мне интересно, не хватает ли я чего-то: возможно ли это обобщение по нескольким переменным. Например: library(dplyr) library(reshape2) (df=dput(structure(list(sex = structure(c(1L, 1L, 2L, 2L), .Label = c("boy", "girl...
22 янв. '14 в 23:04
5

Добавить несколько столбцов в R data.table в одном вызове функции?

У меня есть функция, которая возвращает два значения в списке. Оба значения должны быть добавлены в таблицу данных в двух новых столбцах. Оценка функции является дорогостоящей, поэтому я бы хотел избежать вычисления функции дважды. Вот пример: libra...
03 июл. '12 в 10:13
4

Фильтрация дублированных/неповторных строк в data.table

У меня есть таблица data.table с примерно 2,5 миллионами строк. Есть два столбца. Я хочу удалить любые строки, которые дублируются в обоих столбцах. Раньше для data.frame я бы сделал следующее: df -> unique(df[,c('V1', 'V2')]), но это не работает...
03 авг. '12 в 8:58
4

Правильный/быстрый способ изменения таблицы данных.

У меня есть таблица данных в R: library(data.table) set.seed(1234) DT <- data.table(x=rep(c(1,2,3),each=4), y=c("A","B"), v=sample(1:100,12)) DT x y v [1,] 1 A 12 [2,] 1 B 62 [3,] 1 A 60 [4,] 1 B 61 [5,] 2 A 83 [6,] 2 B 97 [7,] 2 A ...
01 авг. '11 в 17:27
1

имя столбца pass в таблице data.table с использованием переменной в R

Возможный дубликат: Возможность выбора/назначения полей в таблице data.table В следующем примере я создаю таблицу данных с именами столбцов "x" и "v library('data.table') DT = data.table(x=c("b","b","b","a","a"),v=rnorm(5)) DT$ DT$v DT$x Я...
26 сент. '12 в 14:23
6

Как применить одну и ту же функцию к каждому указанному столбцу в таблице данных.

У меня есть таблица данных, с которой я хотел бы выполнить одну и ту же операцию в определенных столбцах. Имена этих столбцов указаны в символьном векторе. В этом конкретном примере я хотел бы умножить все эти столбцы на -1. Некоторые данные игрушки...
30 мая '13 в 21:44