Скользящее среднее значение в postgresql

У меня есть следующая таблица в моей базе данных Postgresql 9.1:

select * from ro;
date       |  shop_id | amount 
-----------+----------+--------
2013-02-07 |     1001 |      3
2013-01-31 |     1001 |      2
2013-01-24 |     1001 |      1
2013-01-17 |     1001 |      5
2013-02-10 |     1001 |     10
2013-02-03 |     1001 |      4
2012-12-27 |     1001 |      6
2012-12-20 |     1001 |      8
2012-12-13 |     1001 |      4
2012-12-06 |     1001 |      3
2012-10-29 |     1001 |      3

Я пытаюсь получить данные о сравнении скользящего среднего значения против прошлых 3 четвергов без включения текущего четверга. Вот мой вопрос:

select date, shop_id, amount, extract(dow from date),
avg(amount) OVER (PARTITION BY extract(dow from date) ORDER BY date DESC
                      ROWS BETWEEN 0 PRECEDING AND 2 FOLLOWING)                          
from ro
where extract(dow from date) = 4

Это - данный результат

date       |  shop_id | amount | date_part |        avg         
-----------+----------+--------+-----------+--------------------
2013-02-07 |     1001 |      3 |         4 | 2.0000000000000000
2013-01-31 |     1001 |      2 |         4 | 2.6666666666666667
2013-01-24 |     1001 |      1 |         4 | 4.0000000000000000
2013-01-17 |     1001 |      5 |         4 | 6.3333333333333333
2012-12-27 |     1001 |      6 |         4 | 6.0000000000000000
2012-12-20 |     1001 |      8 |         4 | 5.0000000000000000
2012-12-13 |     1001 |      4 |         4 | 3.5000000000000000
2012-12-06 |     1001 |      3 |         4 | 3.0000000000000000

Я ожидаю

date       |  shop_id | amount | date_part |        avg         
-----------+----------+--------+-----------+--------------------
2013-02-07 |     1001 |      3 |         4 | 2.6666666666666667
2013-01-31 |     1001 |      2 |         4 | 4.0000000000000000
2013-01-24 |     1001 |      1 |         4 | 6.3333333333333333
2013-01-17 |     1001 |      5 |         4 | 6.0000000000000000
2012-12-27 |     1001 |      6 |         4 | 5.0000000000000000
2012-12-20 |     1001 |      8 |         4 |
2012-12-13 |     1001 |      4 |         4 |
2012-12-06 |     1001 |      3 |         4 |
17
nl ja de
+1 хороший вопрос - версия Pg, типовые данные, ожидала результаты. Спасибо! Преобразованный в SQLFiddle здесь: sqlfiddle.com/#! 1/18891/1
добавлено автор Craig Ringer, источник
BTW, "дата" - ужасное имя столбца, с тех пор it' s название типа данных. Избегайте использования его. Если необходимо использовать его, всегда квалифицировать его с псевдонимом стола и двойной кавычкой это, как показано здесь: sqlfiddle.com/#! 1/18891/4
добавлено автор Craig Ringer, источник
Спасибо Крэйг:) Это - просто типовой набор данных с очень большого стола. Я точно так же, как, чтобы разобраться в вопросе сначала.
добавлено автор Glicious, источник

2 ответы

Скрипка SQL

select
    "date",
    shop_id,
    amount,
    extract(dow from date),
    case when
        row_number() over (order by date) > 3
        then
            avg(amount) OVER (
                ORDER BY date DESC
                ROWS BETWEEN 1 following AND 3 FOLLOWING
            )
        else null end
from (
    select *
    from ro
    where extract(dow from date) = 4
) s

Что не так с вопросом OP спецификация структуры:

ROWS BETWEEN 0 PRECEDING AND 2 FOLLOWING

Кроме того моего вопроса избегает ненужного вычисления, фильтруя четверги прежде, чем применить дорогие функции окна.

Если это необходимо для разделения shop_id, тогда, очевидно, добавляют разделение shop_id к обеим функциям, в среднем и row_number .

12
добавлено
В то время как это, кажется, ведет себя прекрасное, могло бы стоить объяснить, что было неправильным со старым; почему это потерпело неудачу. That' ll помогают OP, и другие учатся, не только решают непосредственную проблему
добавлено автор Craig Ringer, источник
Спасибо Clodoalo:) Кажется мне, что функция windowing, что я использовал РЯДЫ МЕЖДУ 0 ПРЕДЫДУЩИМИ И 2 следующими, должна была быть РЯДАМИ МЕЖДУ 1 после, И 3 следующих Имеет прекрасный смысл! I' ll пробуют это на моем большем наборе данных через несколько часов и советуют:) Еще раз спасибо!
добавлено автор Glicious, источник

Я думаю, что лучший ответ мог бы быть:

SELECT date, shop_id, amount, 
    extract(dow from date) AS dow,
    CASE WHEN count(amount) OVER w = 3 
        THEN avg(amount) OVER w END AS average_amt             
FROM ro
WHERE extract(dow from date) = 4 
WINDOW w AS (ORDER BY date DESC ROWS BETWEEN 1 FOLLOWING AND 3 FOLLOWING)

Я думаю, что это более чисто, чтобы использовать то же самое окно и для проверки количества рядов в окне и для взятие среднего числа. (Это также экономит два скопления окна, как видно в оригинальном ответе.)

Относительно требования в более раннем ответе, что "мой вопрос избегает ненужного вычисления, фильтруя четверги прежде, чем применить дорогие функции окна", это также относится к вопросу, предложенному OP и к моему вопросу, как прилагающий , ОБЪЯСНЯЮТ к любому шоу.

4
добавлено
Это было такой старой почтой, но спасибо за ваше предложенное решение.:-)
добавлено автор Glicious, источник
pgsql – PostgreSQL
pgsql – PostgreSQL
2 429 участник(ов)

Чат про PostgreSQL

DBA - русскоговорящее сообщество
DBA - русскоговорящее сообщество
1 345 участник(ов)

Общаемся и обсуждаем темы, посвященные DBA, PostgreSQL, Redis, MongoDB, MySQL, neo4j, riak и т.д. См. также: @devops_ru, @kubernetes_ru, @docker_ru, @nodejs_ru Рекомендуем сразу отключить уведомления, чтобы пребывание здесь было полезным и комфортным.

Infernal Math
Infernal Math
389 участник(ов)

http://www.zepta.ru/index.php?title=Заглавная_страница Приглашение в чат: https://t.me/matheden

comput.math
comput.math
289 участник(ов)

Прикладная математика и численные методы. Без оффтопа, рекламы, флуда. Вышмат: @higher_math Физика: @physpub Новичкам: @starter_math @JuliaLanguage @rlang_ru Книги брать здесь: libgen.io И по хештегу #book

higher.math
higher.math
234 участник(ов)

Higher mathematics / высшая математика Подборка книжек: https://ru.stackoverflow.com/a/683632/1084 Вычмат: @comput_math Физика: @physpub LaTeX: @pro_latex

Starter Math
Starter Math
79 участник(ов)

Для тех, кто боится спросить в @higher_math Вычмат: @comput_math Физика: @physpub