Вопросы с тегом 'data.table'

Пакет данных R.table является расширением data.frame, созданным для быстрого анализа данных в памяти. Используйте тег dt для пакета DataTables с помощью Shiny (DT).
1

data.table комплексная манипуляция с устранением строк

Пример данных ниже: у меня 3 миллиона строк. Дата, идентификатор, тип, кол-во 9/30/14,1, А, 10 9/30/14,2, Z 12 9/30/14,3, В, 15 9/30/14,1, В, 20 9/30/14,1, Z 20 9/30/14,1, А, 20 9/30/14,2, В, 20 9/30/14,3, В, 5 9/30/14,3, А, 40 Я хочу п...
16 мая '15 в 19:56
3

Слияние данных.tables с использованием "on" не выполняется

У меня есть два кадра данных разных размеров, назовите их df1 и df2. Оба они имеют столбцы целых чисел, называемые Product и Output. df2 имеет уникальный столбец с номерами, называемый ActualOne. Я хочу добавить все значения ActualOne из df2 в df1,...
19 окт. '15 в 18:46
1

Вычислить на data.table с условием

У меня проблема. У меня есть таблица данных: a <- data.table(a=c(1,2,3,50,100,300,700)) a 1: 1 2: 2 3: 3 4: 50 5: 100 6: 300 7: 700 Теперь я хочу создать новый столбец b с b=125-0.25a, однако с условием, что b> = ...
28 февр. '16 в 16:09
1

Импортировать csv через прокрутку первой строки и заголовка на второй строке

Попытка импортировать csv, используя fread из пакета data.table. Необходимо пропустить первые две строки. В первой строке есть тарабарщина. Вторая строка имеет заголовки. Следующий код read.csv делает то, что мне нужно: data <- read.csv(file="C:/...
04 мая '16 в 16:50
1

R data.table внутри цикла работает очень медленно

У меня есть 100 000 пользователей, каждый из которых имеет временные ряды около 1000 значений временных рядов, для которых я хотел бы рассчитать метрики. К сожалению, мой существующий код работает очень медленно, я полагаю, в основном, из-за операци...
20 июл. '16 в 9:14
1

подмножество столбцов в виде данных

Пример R: n = c(2, 3, 5) s = c("aa", "bb", "cc") b = c(TRUE, FALSE, TRUE) df = data.frame(n, s, b) Я могу легко подмножать столбцы в такте данных следующим образом: df.smaller <- df[c(1,2)] n s 1 2 aa 2 3 bb 3 5 cc Очень удобно! Одн...
22 июл. '16 в 8:22
1

CSV импортированная таблица данных не может использоваться для графика гистограммы

Я создал свой собственный набор данных с именем Kwality.csv в Excel, и когда я выполняю код выше, я не могу получить гистограмму для одних и тех же данных, и это бросает мне такую ошибку: Ошибка в файле hist.default(mydata): 'x' должен быть числов...
23 сент. '18 в 23:36
2

левое соединение в data.table

Я пытаюсь сделать левое соединение в data.table, я хочу присоединиться panelFull и panel на основе OutletID. С panel я хочу, чтобы столбец CellID был вставлен в panelFull: > panel[1:15,] Period CellID OutletID ACV 1: 215 1268 M4...
01 окт. '15 в 9:29
1

Именование столбцов в таблице данных в R

У меня две таблицы данных: D1 и D2. D1 - 20 на 181, а D2 - на 181 на 1. Я хочу изменить имя столбцов D1 на значения в D2. Я использую следующий код, но я получаю сообщение об ошибке: for(i in 1 : ncol(D1) ){ names(D1)[i] <- c("D2[i,1]") Ошибка:...
21 нояб. '14 в 19:52
1

Создавать множественные выходные данные из нескольких входных данных в R в обобщаемом виде

У меня есть n входных данных, каждый из которых имеет один столбец TimeStamp + k числовых значений. Я хочу, чтобы преобразовать их в k выходных dataframes каждый из них будет иметь один TimeStamp столбец + n числовых столбцов значений, так что числ...
22 дек. '16 в 7:21
1

Улучшение скорости функции R (избегая цикла)?

Таким образом, у меня есть набор данных панели, и я хотел бы назначить некоторые фиктивные переменные для изменений/увеличения переменной (x) из года в год для каждого идентификатора. Я написал функцию, которая делает именно то, что я хочу. К сожале...
15 февр. '17 в 12:52
1

Сопоставление текстовых имен в R data.table

Я хотел бы объединить различные data.tables с данными исполнителя. Однако имена артистов написаны по-разному в некоторых моих наборах данных. Я ищу простой и удобный способ сопоставить имена этих художников, чтобы дать каждому художнику идентификато...
31 июл. '17 в 12:02
1

Что такое замещающая идиома для sapply в data.table?

Я просто хочу рассчитать максимальные значения для каждого столбца отдельно. Использование простого sapply перешло в переполнение памяти: # dt is my data.table object res <- sapply(dt, max, na.rm=T) # fails due to memory problems Это редкая т...
08 дек. '16 в 12:28