Вопросы с тегом 'pandas'

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймы данных, многомерные временные ряды и перекрестные наборы данных, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.
5

Конвертировать список словарей в панду DataFrame

У меня есть список словарей, как это: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] И я хочу превратить ...
17 дек. '13 в 15:24
10

Довольно распечатать всю серию Pandas/DataFrame

Я много работаю с Series и DataFrames на терминале. Значение по умолчанию __repr__ для серии возвращает уменьшенную выборку с некоторыми значениями __repr__ и хвоста, но остальные отсутствуют. Есть ли встроенный способ красивой печати всей серии /D...
01 окт. '13 в 19:46
16

Как расширить выводной дисплей, чтобы увидеть больше столбцов?

Есть ли способ расширить отображение вывода в интерактивном режиме или режиме исполнения сценария? В частности, я использую функцию describe() в dataframe Pandas. Когда dataframe составляет 5 столбцов (ярлыков) в ширину, я получаю описательную стат...
29 июл. '12 в 7:44
13

Как бороться с SettingWithCopyWarning в Pandas?

Фон Я только что обновил свой Pandas от 0.11 до 0.13.0rc1. Теперь приложение выдает много новых предупреждений. Один из них: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. ...
17 дек. '13 в 3:48
4

объяснение панд илок против IX и лок; насколько они разные?

Может кто-нибудь объяснить, как эти три метода нарезки различны? Я видел документы, и я видел эти ответы, но я все еще не могу объяснить, как эти три разные. Для меня они кажутся взаимозаменяемыми в значительной степени, потому что они находятся на ...
23 июл. '15 в 16:34
9

Преобразование вывода Pandas GroupBy из Series в DataFrame

Я начинаю с входных данных, подобных этому df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Что при печати вы...
29 апр. '12 в 16:10
8

Удаление строки DataFrame в Pandas на основе значения столбца

У меня есть следующий DataFrame: daysago line_race rating rw wrating line_date 2007-03-31 62 11 56 1.000000 56.000000 2007-03-10 83 11 ...
11 авг. '13 в 14:14
18

Как проверить, является ли какое-либо значение NaN в Pandas DataFrame

В Python Pandas, как лучше всего проверить, имеет ли DataFrame одно (или более) значение NaN? Я знаю о функции pd.isnan, но она возвращает DataFrame логических значений для каждого элемента. Этот пост прямо здесь не совсем отвечает на мой вопрос.
09 апр. '15 в 5:09
21

Объедините два столбца текста в dataframe в pandas/python

У меня есть 20 x 4000 фрейм данных в python, используя pandas. Две из этих столбцов называются Год и квартал. Я хотел бы создать переменную, называемую периодом, которая делает Year = 2000 и quarter = q2 в 2000q2 Может ли кто-нибудь помочь с этим?
15 окт. '13 в 9:42
18

Установить значение для конкретной ячейки в панде DataFrame, используя индекс

Я создал Pandas DataFrame df = DataFrame(index=['A','B','C'], columns=['x','y']) и получил это x y A NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки "C" и столбца "x". Я ожидал...
12 дек. '12 в 14:40
24

Как посчитать значения NaN в столбце в панде DataFrame

У меня есть данные, в которых я хочу найти число NaN, так что, если оно меньше некоторого порога, я отброшу эти столбцы. Я посмотрел, но не смог найти никакой функции для этого. есть value_counts, но он будет медленным для меня, потому что большинс...
08 окт. '14 в 21:00
13

Как я могу заменить все значения NaN на Zero в столбце pandas dataframe

У меня есть dataframe, как показано ниже itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-0...
08 нояб. '12 в 18:50
10

Разница между методами map, applymap и apply в Pandas

Можете ли вы рассказать мне, когда использовать эти методы векторизации с базовыми примерами? Я вижу, что map является методом Series тогда как остальные - методы DataFrame. Однако я запутался в методах apply и applymap. Почему у нас есть два метод...
05 нояб. '13 в 20:20
5

Получить статистику для каждой группы (например, количество, среднее и т.д.), Используя pandas GroupBy?

У меня есть фрейм данных df и я использую несколько столбцов из него для groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это до...
15 окт. '13 в 15:00
9

Как отфильтровать кадр данных Pandas, используя 'in' и 'not in', как в SQL

Как я могу получить эквиваленты SQL IN и NOT IN? У меня есть список с требуемыми значениями. Здесь сценарий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countr...
13 нояб. '13 в 17:11