Пакет статистики Python: разница между statsmodel и scipy.stats

Мне нужно несколько советов по выбору пакета статистики для Python, я сделал довольно некоторый поиск, но не уверен, что все правильно, в частности, о различиях между statsmodels и scipy.stats.

Одна вещь, которую я знаю, это те, у кого есть пространство имен scikits, являются конкретными «ветвями» scipy, и то, что раньше было scikits.statsmodels, теперь называется statsmodels. С другой стороны, есть также scipy.stats. Каковы различия между ними, а какой - пакет статистики для Python?

Благодарю.

--РЕДАКТИРОВАТЬ--

Я изменил название, потому что некоторые ответы действительно не связаны с вопросом, и я полагаю, это потому, что заголовок недостаточно ясен.

17
nl ja de

3 ответы

Statsmodels имеет scipy.stats как зависимость. Scipy.stats имеет все распределения вероятностей и некоторые статистические тесты. Это больше похоже на библиотечный код в вене numpy и scipy. Statsmodels, с другой стороны, предоставляют статистические модели с формулой, аналогичной R, и она работает с pandas DataFrames. В статистических моделях также есть статистические тесты, построение графика и множество вспомогательных функций. На самом деле это зависит от того, что вам нужно, но вам определенно не нужно выбирать. У них разные цели и сильные стороны.

28
добавлено
«Пакет статистики в python - оба вместе. scipy.stats имеет большое количество распределений, большинство общих параметрических и непараметрических статистических тестов и описательную статистику. статистические модели гораздо более ориентированы на оценку статистических моделей. Говоря как один из тех, кто поддерживает scipy.stats и statsmodels, мы стараемся сохранить дублирование кода на очень низком уровне.
добавлено автор Josef, источник
Это именно тот ответ, который я ищу. Я очень хорошо знаю R и что вы можете с ним сделать, включая взаимодействие с Python. И я не ищу сравнения различных статистических программ. Вопрос был конкретно связан с отношением (т. Е. Разницей) между statsmodel и scipy.stats в Python. Я знаю, что stackoverflow полон компетентных крутых парней, таких как вы, спасибо! (кроме тех, кто закрыл вопрос, вы, ребята, не круты ........... Я просто шучу, конечно)
добавлено автор herrfz, источник

Я пытаюсь использовать pandas/statsmodels/scipy для своей работы на ежедневной основе, но иногда эти пакеты немного коротки (LOESS, кто-нибудь?). Проблема с модулем RPy (последний раз я проверил, по крайней мере), что он хочет, чтобы определенная версия R не была текущей. Моя установка R - 2.16 (я думаю), а RPy - 2.14. Таким образом, либо вы должны иметь две параллельные установки R, либо вам нужно понизить. (Если у вас нет R, то вы можете просто установить правильную версию R и использовать RPy.)

Поэтому, когда мне нужно что-то не в pandas/statsmodels/scipy, я пишу R-скрипты и запускаю их с помощью модуля subprocess . Это позволяет мне взаимодействовать с R как можно меньше (что мне действительно не нравится в программировании), но я все еще могу использовать все, что R имеет, что пакеты Python этого не делают.

Урок состоит в том, что ни одна проблема не существует one - вам нужно собрать целую кучу деталей, которые вам полезны (и, возможно, написать некоторые из ваших собственных), в способ, который вы понимаете, решать проблемы. (Разумеется, не согласятся, конечно!)

3
добавлено
добавлено автор Josef, источник
(Мне не удалось отредактировать мой комментарий.) Я согласен, в питоне все еще есть много методов.
добавлено автор Josef, источник
Это просто отражение размеров и специализаций соответствующих сообществ. Я думаю, что сообщество Python растет намного быстрее, чем сообщество R, хотя для простого факта, что вы можете получить работу как кодер Python гораздо проще, чем как R-кодер. По крайней мере, это то, что я бы сказал МОИМ аспирантам :)
добавлено автор BenDundee, источник
За четыре года с тех пор, как я написал это, есть лучшие решения: blog.rstudio .org/2016/03/29/перо
добавлено автор BenDundee, источник

Я думаю, что пакет статистики numpy/scipy. Он отлично работает, если вы хотите распечатать свои данные с помощью matplotlib. Однако, насколько мне известно, matplotlib еще не работает с Python 3.x.

1
добавлено
numpy, scipy, matplotlib и statsmodels работают на python 3. matplotlib с момента последней версии, но я использовал невыпущенную версию matplotlib на python 3 почти год.
добавлено автор Josef, источник
хороший! хорошо знать, что он уже официально доступен. спасибо за подсказку!
добавлено автор user2015601, источник
Python
Python
7 654 участник(ов)

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/577926

Python beginners
Python beginners
4 449 участник(ов)

Вопросы про Python для чайников. Cпам и троллинг неприемлем. Не злоупотребляйте стикерами. Частозадаваемые вопросы: https://github.com/ru-python-beginners/faq/blob/master/README.md Статистика тут: https://grstats.me/chat/x4qym2k5uvfkr3al6at7

pro.python
pro.python
1 090 участник(ов)

Сообщество разработчиков под Python Создатель: @rodgelius

Rude Python
Rude Python
971 участник(ов)

Python без „девочек”, здесь матерятся и унижают Django. Not gay friendly. Правила: t.me/rudepython/114107 @rudepython | t.me/rudepython

rupython
rupython
509 участник(ов)

Группа создана с целью оперативного получения ответов на возникающие вопросы по разработке на яп python, смежные темы, а также человеческого общения. Приветствую!

Python-programming
Python-programming
266 участник(ов)

Чат группы вконтакте https://vk.com/python_community