Вопросы с тегом 'dataframe'

Кадр данных представляет собой структуру табличных данных. Обычно он содержит данные, в которых строки являются наблюдениями, а столбцы являются переменными различных типов. Хотя «фрейм данных» или «dataframe» - это термин, используемый для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «table» - это термин, используемый в MATLAB и SQL.
2
ответа

Как получить значение из Pandas DataFrame, а не индекс и тип объекта

Скажем, у меня есть следующий DataFrame Letter Number A 1 B 2 C 3 D 4 Что можно получить с помощью следующего кода import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((...
задан 11.06.2015 в 19:48
3
ответа

pandas dataframe умножить на ряд

Каков наилучший способ умножить все столбцы Pandas DataFrame на вектор столбца, хранящийся в Series ? Раньше я делал это в Matlab с repmat() , которого нет в Pandas. Я могу использовать np.tile() , но выглядит уродливо, чтобы каждый раз...
задан 31.10.2012 в 21:20
4
ответа

Развернуть фрейм данных в комбинации пар строк

У меня есть кадр данных, который содержит столбец идентификатор / ключ, за которым следуют несколько столбцов столбцов значений. Я хочу расширить столбец данных, взяв уникальные пары записей в ключевом столбце в качестве новых строк и преобразуя...
задан 18.05.2015 в 22:05
3
ответа

Сортировка кадра данных Pandas и печать самых высоких значений n

У меня есть кадр данных pandas, и я хочу сортировать столбец («Bytes») в порядке убывания и печатать самые высокие 10 значений и связанное с ним значение столбца «Клиентский IP». Предположим, что следующее является частью моего фрейма. У меня мн...
задан 06.06.2013 в 11:30
3
ответа

Показывать столбцы с NA в файле data.frame

Я хотел бы показать имена столбцов в большом фреймворке данных, которые содержат отсутствующие значения. В принципе, я хочу эквивалент complete.cases (df), но для столбцов, а не строк. Некоторые столбцы не являются числовыми, поэтому что-то врод...
задан 13.05.2012 в 20:13
3
ответа

Работа с повторяющимися задачами в R

Я часто сталкиваюсь с необходимостью выполнять повторяющиеся задачи в R. Крайне сложно расходовать постоянную работу одной и той же функции на одной или нескольких структурах данных снова и снова. Например, допустим, у меня есть три отдельных...
задан 12.05.2011 в 04:15
1
ответ

Изменение строковых параметровAsFactors для data.frame

У меня есть функция, в которой я определяю data.frame , что я использую циклы для заполнения данными. В какой-то момент я получаю сообщение «Предупреждение»:    Предупреждающие сообщения:   1: В [<-.factor ( *tmp* , iseq, value="CHA...
задан 18.07.2012 в 11:42
1
ответ

объединяет два или более информационных кадра в системе R

Мои вопросы: как присоединиться к двум или более кадрам данных в системе R? Например: У меня есть два кадра данных: первый: x y z 1 3 2 4 2 4 5 7 3 5 6 8 второй: x y z 1 1 1 1 2 4 5 7 Мне нужно это...
задан 10.11.2010 в 06:47
1
ответ

Время вылета из даты и времени [M8] в Пандах

Итак, у меня есть столбец «Дата» в моем кадре данных, где даты имеют формат, подобный этому 0 1998-08-26 04:00:00 Если я хочу только месяц и день года, как я могу отказаться от тривиального часа?     
задан 16.07.2014 в 18:40
2
ответа

Превышение предела памяти в R (даже с ОЗУ 24 ГБ)

Я пытаюсь объединить два dataframes: один имеет 908450 наблюдений 33 переменных, а другой имеет 908450 наблюдений за 2 переменными. dataframe2 <-merge(dataframe1, dataframe2, by="id") Я очистил все остальные данные из рабочей памяти и...
задан 19.07.2012 в 18:00