Агрегатные функции

ClickHouse поддерживает все стандартные агрегатные функции SQL (sum, avg, min, max, count), а также широкий набор других агрегатных функций.

Страница	Описание
aggThrow	Эта функция может использоваться для проверки безопасной работы кода при исключениях. При создании она будет генерировать исключение с указанной вероятностью.
analysisOfVariance	Предоставляет статистический критерий для однофакторного дисперсионного анализа (ANOVA-тест). Это критерий для нескольких групп нормально распределённых наблюдений, позволяющий определить, одинаковы ли средние значения во всех группах или нет.
any	Возвращает первое встретившееся значение столбца.
anyHeavy	Выбирает часто встречающееся значение с использованием алгоритма «heavy hitters». Если существует значение, которое встречается более чем в половине случаев в каждом из потоков выполнения запроса, возвращается это значение. Как правило, результат недетерминирован.
anyLast	Возвращает последнее встретившееся значение столбца.
approx_top_k	Возвращает массив приблизительно наиболее часто встречающихся значений и их частот в указанном столбце.
approx_top_sum	Возвращает массив приблизительно наиболее часто встречающихся значений в указанном столбце и соответствующих им счётчиков.
argMax	Вычисляет значение `arg` при максимальном значении `val`.
argMin	Вычисляет значение `arg` для минимального значения `val`. Если существует несколько строк с одинаковым значением `val`, являющимся максимальным, то то, какое из связанных значений `arg` будет возвращено, не определено.
argAndMax	Вычисляет значения `arg` и `val` для максимального значения `val`. Если существует несколько строк с одинаковым максимальным значением `val`, то какие из соответствующих значений `arg` и `val` будут возвращены, недетерминированно.
argAndMin	Вычисляет значения `arg` и `val` для минимального значения `val`. Если существует несколько строк с одинаковым минимальным значением `val`, то выбор того, какие связанные `arg` и `val` будут возвращены, недетерминирован.
groupArrayArray	Объединяет массивы в один массив, элементы которого представляют собой исходные массивы.
avg	Вычисляет арифметическое среднее.
avgWeighted	Вычисляет взвешенное арифметическое среднее.
boundingRatio	Агрегатная функция, вычисляющая наклон между самой левой и самой правой точками в группе значений.
categoricalInformationValue	Вычисляет значение `(P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0)))` для каждой категории.
contingency	Функция `contingency` вычисляет коэффициент сопряжённости — величину, которая измеряет степень связи между двумя столбцами в таблице. Расчёт аналогичен функции `cramersV`, но используется другой знаменатель под знаком квадратного корня.
corr	Вычисляет коэффициент корреляции Пирсона.
corrMatrix	Вычисляет матрицу корреляции для N переменных.
corrStable	Вычисляет коэффициент корреляции Пирсона, но при этом использует численно устойчивый алгоритм.
count	Подсчитывает количество строк или значений, отличных от NULL.
covarPop	Вычисляет ковариацию генеральной совокупности
covarPopMatrix	Возвращает ковариационную матрицу генеральной совокупности по N переменным.
covarPopStable	Вычисляет ковариацию по генеральной совокупности
covarSamp	Вычисляет значение выражения `Σ((x - x̅)(y - y̅)) / (n - 1)`
covarSampMatrix	Возвращает выборочную ковариационную матрицу для N переменных.
covarSampStable	Аналогична `covarSamp`, но работает медленнее, при этом обеспечивая меньшую погрешность вычислений.
cramersV	Результат функции `cramersV` лежит в диапазоне от 0 (значение 0 соответствует отсутствию зависимости между переменными) до 1 и может достигать 1 только в том случае, если каждое значение полностью определяется другим. Его можно рассматривать как степень связи между двумя переменными, выраженную в процентах от её максимально возможной величины.
cramersVBiasCorrected	Вычисляет V Крамера с поправкой на смещение.
deltaSum	Вычисляет сумму арифметических разностей между соседними строками.
deltaSumTimestamp	Вычисляет разность между соседними строками. Если разность отрицательная, она игнорируется.
entropy	Вычисляет энтропию Шеннона для столбца значений.
estimateCompressionRatio	Оценивает коэффициент сжатия для указанного столбца без фактического выполнения сжатия.
exponentialMovingAverage	Вычисляет экспоненциальное скользящее среднее значений за заданный период времени.
exponentialTimeDecayedAvg	Возвращает экспоненциально сглаженное взвешенное скользящее среднее значений временного ряда в момент времени `t`.
exponentialTimeDecayedCount	Возвращает накопленное экспоненциальное затухание во временном ряду в момент времени с индексом `t`.
exponentialTimeDecayedMax	Возвращает максимальное значение экспоненциально сглаженного скользящего среднего между его значениями в моменты времени `t` и `t-1`.
exponentialTimeDecayedSum	Возвращает сумму значений экспоненциально сглаженного скользящего среднего временного ряда в момент времени `t`.
first_value	Это псевдоним агрегатной функции `any`, но он был введён для совместимости с оконными функциями (Window Functions), где иногда необходимо обрабатывать значения `NULL` (по умолчанию все агрегатные функции ClickHouse игнорируют значения `NULL`).
flameGraph	Агрегатная функция, которая строит flamegraph на основе списка трассировок стека.
groupArray	Создаёт массив значений аргументов. Значения могут добавляться в массив в произвольном порядке.
groupArrayInsertAt	Вставляет значение в массив на указанную позицию.
groupArrayIntersect	Возвращает пересечение указанных массивов (все элементы, которые присутствуют во всех указанных массивах).
groupArrayLast	Создает массив из последних значений переданного аргумента.
groupArrayMovingAvg	Вычисляет скользящее среднее значений на входе.
groupArrayMovingSum	Вычисляет скользящую сумму входных значений.
groupArraySample	Создаёт массив выборочных значений аргументов. Размер результирующего массива составляет не более `max_size` элементов. Значения аргументов выбираются и добавляются в массив случайным образом.
timeSeriesGroupArray	Сортирует временные ряды по временной метке в порядке возрастания.
groupArraySorted	Возвращает массив с первыми N элементами в порядке возрастания.
groupBitAnd	Выполняет побитовую операцию `AND` над последовательностью чисел.
groupBitmap	Bitmap- или агрегирующие вычисления по беззнаковому целочисленному столбцу возвращают кардинальность типа UInt64; если добавить суффикс -State, возвращается объект bitmap
groupBitmapAnd	Вычисляет операцию AND для битмапового столбца и возвращает мощность множества в виде значения типа UInt64; при добавлении суффикса -State возвращает объект битмапа.
groupBitmapOr	Вычисляет побитовое OR битмап-столбца и возвращает мощность множества типа UInt64; если добавить суффикс -State, функция возвращает объект битмапа. Эквивалентна `groupBitmapMerge`.
groupBitmapXor	Вычисляет XOR bitmap-столбца и возвращает кардинальность в виде значения типа UInt64; при использовании с суффиксом -State возвращает объект bitmap
groupBitOr	Выполняет побитовое `OR` над последовательностью чисел.
groupBitXor	Применяет операцию побитового `XOR` к последовательности чисел.
groupUniqArray	Создаёт массив из значений аргументов.
intervalLengthSum	Вычисляет общую длину объединения всех интервалов (отрезков на числовой оси).
kolmogorovSmirnovTest	Применяет критерий Колмогорова–Смирнова к выборкам из двух генеральных совокупностей.
kurtPop	Вычисляет эксцесс последовательности значений.
kurtSamp	Вычисляет выборочный эксцесс для последовательности.
largestTriangleThreeBuckets	Применяет алгоритм Largest-Triangle-Three-Buckets к входным данным.
last_value	Выбирает последнее встреченное значение, аналогично `anyLast`, но допускает значение NULL.
mannWhitneyUTest	Применяет ранговый критерий Манна — Уитни к выборкам из двух генеральных совокупностей.
max	Агрегатная функция, вычисляющая максимум по группе значений.
maxIntersections	Агрегатная функция, вычисляющая максимальное количество пересечений в группе интервалов (при условии, что все интервалы пересекаются хотя бы один раз).
maxIntersectionsPosition	Агрегатная функция, вычисляющая позиции вхождений функции maxIntersections.
maxMap	Вычисляет максимум из массива `value` по ключам, указанным в массиве `key`.
meanZTest	Применяет z‑критерий для проверки среднего по выборкам из двух генеральных совокупностей.
median	Функции `median` являются синонимами соответствующих функций `quantile`. Они вычисляют медиану числовой выборки данных.
min	Агрегатная функция, вычисляющая минимум по группе значений.
minMap	Вычисляет минимальное значение из массива `value` по ключам, указанным в массиве `key`.
quantile	Вычисляет приближённый квантиль последовательности числовых данных.
quantileBFloat16	Вычисляет приближённый квантиль выборки, состоящей из чисел типа bfloat16.
quantileDD	Вычисляет приближённый квантиль выборки с гарантированной относительной погрешностью.
quantileDeterministic	Вычисляет приближённый квантиль для числовой последовательности данных.
Функции quantileExact	функции quantileExact, quantileExactLow, quantileExactHigh, quantileExactExclusive, quantileExactInclusive
quantileExactWeighted	Точно вычисляет квантиль последовательности числовых данных с учётом веса каждого элемента.
quantileGK	Вычисляет квантиль последовательности числовых данных с использованием алгоритма Гринвальда–Кханны.
quantileExactWeightedInterpolated	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
quantileInterpolatedWeighted	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
Функции quantiles	quantiles, quantilesExactExclusive, quantilesExactInclusive, quantilesGK
quantileTDigest	Вычисляет приближённый квантиль для числовой последовательности данных с помощью алгоритма t-digest.
quantileTDigestWeighted	Вычисляет приближённый квантиль последовательности числовых данных с использованием алгоритма t-digest.
quantileTiming	С заданной точностью вычисляет квантиль числовой последовательности.
quantileTimingWeighted	С определённой точностью вычисляет квантиль числовой последовательности данных с учётом веса каждого её элемента.
rankCorr	Вычисляет коэффициент ранговой корреляции.
simpleLinearRegression	Выполняет простую (одномерную) линейную регрессию.
singleValueOrNull	Агрегатная функция `singleValueOrNull` используется для реализации операторов с подзапросами, таких как `x = ALL (SELECT ...)`. Она проверяет, существует ли ровно одно уникальное значение, отличное от NULL, в данных.
skewPop	Вычисляет коэффициент асимметрии последовательности.
skewSamp	Вычисляет выборочную асимметрию последовательности.
sparkbar	Функция строит частотную гистограмму для значений `x` и частоты повторения `y` этих значений на интервале `[min_x, max_x]`.
stddevPop	Результат равен квадратному корню от varPop.
stddevPopStable	Результат равен квадратному корню из varPop. В отличие от stddevPop, эта функция использует численно устойчивый алгоритм.
stddevSamp	Результат равен квадратному корню из varSamp.
stddevSampStable	Результат равен квадратному корню из varSamp. В отличие от функции varSamp, эта функция использует численно устойчивый алгоритм.
stochasticLinearRegression	Эта функция реализует стохастическую линейную регрессию. Она поддерживает пользовательские параметры скорости обучения, коэффициента L2-регуляризации, размера мини-батча и предоставляет несколько методов для обновления весов (Adam, простой SGD, Momentum, Nesterov).
stochasticLogisticRegression	Эта функция реализует стохастическую логистическую регрессию. Ее можно использовать для задач бинарной классификации; она поддерживает те же настраиваемые параметры, что и функция stochasticLinearRegression, и работает аналогичным образом.
studentTTest	Применяет t-критерий Стьюдента к выборкам из двух генеральных совокупностей.
studentTTestOneSample	Применяет одновыборочный t-критерий Стьюдента к выборке и известному значению среднего генеральной совокупности.
sum	Вычисляет сумму. Применима только к числовым значениям.
sumCount	Вычисляет сумму чисел и одновременно считает количество строк. Функция используется оптимизатором запросов ClickHouse: если в запросе присутствует несколько функций `sum`, `count` или `avg`, их можно заменить одной функцией `sumCount`, чтобы повторно использовать результаты вычислений. Как правило, нет необходимости вызывать эту функцию явно.
sumKahan	Вычисляет сумму чисел с использованием компенсированного алгоритма суммирования Кэхэна
sumMap	Суммирует один или несколько массивов `value` в соответствии с ключами, заданными в массиве `key`. Возвращает кортеж массивов: ключи в отсортированном порядке, а затем значения, просуммированные для соответствующих ключей без переполнения.
sumMapWithOverflow	Суммирует массив `value` в соответствии с ключами, указанными в массиве `key`. Возвращает кортеж из двух массивов: ключи в отсортированном порядке и значения, суммированные для соответствующих ключей. Отличается от функции sumMap тем, что выполняет суммирование с переполнением.
sumWithOverflow	Вычисляет сумму чисел, используя для результата тот же тип данных, что и у входных параметров. Если сумма превышает максимальное значение для этого типа данных, она вычисляется с переполнением.
theilsU	Функция `theilsU` вычисляет коэффициент неопределённости Тейла U (Theil's U), величину, которая измеряет взаимосвязь между двумя столбцами в таблице.
topK	Возвращает массив приблизительно самых частых значений в указанном столбце. Результирующий массив упорядочен по убыванию их приблизительной частоты (а не по самим значениям).
topKWeighted	Возвращает массив приблизительно наиболее частых значений в указанном столбце. Полученный массив отсортирован по убыванию приблизительной частоты значений (а не по самим значениям). Также учитывается вес значения.
uniq	Вычисляет приблизительное количество различных значений аргумента.
uniqCombined	Вычисляет приблизительное количество уникальных значений аргумента.
uniqCombined64	Вычисляет приблизительное количество различных значений аргумента. Аналогична uniqCombined, но использует 64-битный хэш для всех типов данных, а не только для типа данных String.
uniqExact	Вычисляет точное количество уникальных значений аргумента.
uniqHLL12	Вычисляет приблизительное число различных значений аргумента с использованием алгоритма HyperLogLog.
uniqTheta	Вычисляет приблизительное количество различных значений аргумента с использованием фреймворка Theta Sketch.
varPop	Вычисляет дисперсию генеральной совокупности.
varPopStable	Возвращает генеральную дисперсию. В отличие от varPop эта функция использует численно устойчивый алгоритм. Работает медленнее, но даёт меньшую вычислительную погрешность.
varSamp	Вычисляет выборочную дисперсию набора данных.
varSampStable	Вычисляет выборочную дисперсию набора данных. В отличие от `varSamp`, эта функция использует численно устойчивый алгоритм. Работает медленнее, но обеспечивает меньшую вычислительную погрешность.
welchTTest	Применяет t‑критерий Уэлча к выборкам из двух генеральных совокупностей.
distinctDynamicTypes	Вычисляет список уникальных типов данных, хранящихся в столбце типа Dynamic.
distinctJSONPaths	Возвращает список уникальных путей, хранящихся в JSON-столбце.
timeSeriesDeltaToGrid	Агрегатная функция, вычисляющая delta в стиле PromQL над данными временных рядов на заданной сетке.
timeSeriesInstantDeltaToGrid	Агрегирующая функция, вычисляющая PromQL-подобный idelta для данных временных рядов на заданной сетке.
timeSeriesInstantRateToGrid	Агрегирующая функция, вычисляющая PromQL-подобный irate по временным рядам на указанной сетке.
timeSeriesLastTwoSamples	Агрегатная функция для ресемплирования данных временных рядов для расчёта PromQL-подобных irate и idelta
timeSeriesRateToGrid	Агрегатная функция, вычисляющая PromQL-подобный rate для данных временных рядов на заданной сетке.
timeSeriesResampleToGridWithStaleness	Агрегатная функция, выполняющая ресемплинг данных временных рядов на заданную сетку.
timeSeriesDerivToGrid	Агрегатная функция, вычисляющая производную в стиле PromQL по данным временных рядов на заданной сетке.
timeSeriesPredictLinearToGrid	Агрегатная функция, вычисляющая линейный прогноз в стиле PromQL по данным временных рядов на заданной сетке.
timeSeriesChangesToGrid	Агрегатная функция, вычисляющая изменения в стиле PromQL по данным временных рядов на заданной сетке.
timeSeriesResetsToGrid	Агрегатная функция, вычисляющая сбросы в стиле PromQL по данным временных рядов на заданной сетке.
groupConcat	Вычисляет строку, полученную конкатенацией строк из группы, с необязательным разделителем и необязательным ограничением на максимальное число элементов.
quantilePrometheusHistogram	Вычисляет квантиль по гистограмме с использованием линейной интерполяции.