Tag: stata

Максимальное значение Python Pandas в группе как новый столбец

Я пытаюсь вычислить новый столбец, который содержит максимальные значения для каждой из нескольких групп. Я исхожу из фона Stata, поэтому я знаю, что код Stata будет примерно таким: by group, sort: egen max = max(odds) Например: data = {'group' : ['A', 'A', 'B','B'], 'odds' : [85, 75, 60, 65]} Тогда я хотел бы, чтобы это […]

Линейная регрессия терпит неудачу в Python с большими значениями в зависимых переменных

Я пытаюсь переписать модель прогнозирования (в Stata) с помощью Python (с pandas.stats.api.ols) и столкнулся с проблемой с линейной регрессией: коэффициенты и перехват, вычисленные pandas , не совпадают с коэффициентами из Stata. Исследование показывает, что основной причиной могут быть значения зависимых значений, очень большие. У меня есть это подозрение, основанное на следующих выводах: 1) Я создал […]

Каков эффективный способ ведения логистической регрессии для больших наборов данных (200 миллионов на 2 переменные)?

В настоящее время я пытаюсь запустить модель логистической регрессии. Мои данные имеют две переменные, одну переменную ответа и одну переменную-предиктор. Уловка состоит в том, что у меня есть 200 миллионов наблюдений. Я пытаюсь запустить модель логистической регрессии, но я очень затрудняюсь сделать это в R / Stata / MATLAB даже с помощью экземпляров EC2 на […]

Запустите файл Stata do из Python

У меня есть скрипт Python который очищает и выполняет базовые статистические вычисления на большом наборе данных панели ( 2,000,000+ observations ). Я считаю, что некоторые из этих задач лучше подходят для Stata и написали файл do с необходимыми командами. Таким образом, я хочу запустить .do-файл в моем коде Python. Как я могу обратиться за .do […]

Миграция из Stata в Python

Некоторые коллеги, которые боролись со Stata 11, просят мою помощь, чтобы попытаться автоматизировать их трудоемкую работу. В основном они используют 3 команды в Stata: tsset (задает анализ временных рядов) как в: tsset year_column, yearly varsoc (Получить статистику выбора лаг-порядка для VAR) как в: varsoc column_a column_b vec (векторная модель коррекции ошибок) как в: vec column_a […]

отправить код из vim во внешнее приложение для выполнения

Я регулярно использую stata на работе. Моим текстовым редактором по выбору является (g) vim. Я использовал сценарии, приведенные здесь или здесь, чтобы отправить код из vim в stata. Эта функциональность очень практична и практически единственная вещь, которая препятствует мне полностью переключиться на Linux. Сценарии написаны в AutoIT, поэтому я не могу использовать их в linux. […]

наиболее эффективная настройка ввода / вывода между Stata и Python (Pandas)

Я использую Stata для обработки некоторых данных, экспорта данных в файл csv и загрузки его в Python с помощью функции pandas read_csv. Проблема в том, что все так медленно. Экспорт из Stata в файл csv занимает много времени (экспорт в формате dta Stata выполняется намного быстрее), а загрузка данных через read_csv также очень медленная. Использование […]

Какие типы языков позволяют программировать создание имен переменных?

Этот вопрос исходит исключительно из интеллектуального любопытства. Просматривая раздел python относительно часто, я видел ряд вопросов, подобных этому , где кто-то просит программный способ определения глобальных переменных. Некоторые из них знают об ошибках exec , другие – нет. Тем не менее, я недавно программировал в Stata, где распространено следующее: local N = 100 local i […]

Получение квантилей SciPy для соответствия функции Stata xtile

Я унаследовал некоторый старый код Stata (Stata11), который использует функцию xtile для классификации наблюдений в векторе по их квантилям (в данном случае только стандартные 5 квинтилей, 20%, 40%, 60%, 80%, 100% ). Я пытаюсь реплицировать часть кода в Python, и я использую функцию mquantiles() для вычисления. Насколько я могу судить по документации Stata и поиску […]

отправка кода из vim в stata

Я использую Vim для написания сценариев Stata в Windows некоторое время в университете. Я изучаю R на данный момент, и я хочу полностью переключиться на Linux в качестве своей ОС (недавно я перешел на Ubuntu на своем ноутбуке). R отлично работает с Vim как в Windows, так и в Linux, но мне все равно иногда […]

Interesting Posts for Van-Lav

Запрос и базовая информация профилирования для Flask

Можно ли свободно распространять распространяемый пакет Microsoft Visual C ++ 2008

Как продлить ресурс Boto3?

Как игнорировать локальный питон при создании питона из источника

Есть ли функция в python для разбиения слова на список?

Преобразование целочисленного значения в строку в Python?

Зачем мне когда-либо использовать что-либо кроме% r в форматировании строк Python?

Изменение синтаксиса оператора python if

Странное поведение при наследовании из списка в python

как получить нормальное выполнение инструкции печати при использовании stdout = subprocess.PIPE во время вызова подпроцесса в python

Вы пытаетесь добавить не-nullable поле 'new_field' в userprofile без дефолта

Как изменить индекс цикла for в Python?

Использование gunicorn для запуска ошибки приложения

django prefetch_related и select_related на родительской таблице

Облицовка препятствия для установки pyobbc и pymssql в ubuntu 16.04

Python - лучший язык программирования в мире.