Комплексное руководство по построению и анализу вычислительных алгоритмов для моделирования временных рядов (АРПСС) в MathCAD и STATISTICA

В мире, где данные генерируются каждую секунду, способность понимать их динамику и предсказывать будущее становится не просто конкурентным преимуществом, а фундаментальной необходимостью. По данным недавних исследований, прогнозирование энергопотребления с помощью временных рядов позволяет достигать средней абсолютной процентной ошибки (MAPE) в диапазоне от 1 до 5%. Это впечатляющий показатель, демонстрирующий практическую ценность и точность методов, которые мы собираемся исследовать. Наше руководство призвано стать не просто сборником инструкций, но и компасом в сложном ландшафте анализа временных рядов, вооружив студентов и молодых специалистов глубокими теоретическими знаниями и конкретными практическими навыками работы с моделями авторегрессии-скользящего среднего (АРПСС) в среде MathCAD и STATISTICA. Итак, как же эффективно применять эти знания для получения столь точных результатов? Ответ кроется в систематическом подходе и понимании каждого этапа моделирования.

Введение в анализ временных рядов и модели АРПСС

Анализ временных рядов является краеугольным камнем в множестве инженерных и технических дисциплин, от обработки сигналов и финансового моделирования до контроля качества и прогнозирования климатических изменений. Он позволяет не только выявлять скрытые закономерности в поведении динамических систем, но и, что особенно важно, строить обоснованные прогнозы их будущего состояния. В этом контексте модели авторегрессии-проинтегрированного скользящего среднего (АРПСС), или ARIMA (Autoregressive Integrated Moving Average), выступают как один из наиболее мощных и универсальных инструментов. Это руководство призвано деконструировать и систематизировать подходы к построению и анализу этих моделей, превращая сложные концепции в понятные и применимые алгоритмы, помогающие решить широкий круг задач.

Что такое временной ряд?

Прежде чем углубляться в хитросплетения моделей, необходимо четко определить их предмет. Временной ряд — это последовательность значений какой-либо характеристики, измеренных или полученных в последовательные моменты времени. Представьте себе ежедневные показания температуры, ежемесячные объемы продаж или посекундные данные о вибрации машины — все это примеры временных рядов. Их ключевая особенность заключается в том, что наблюдения не являются независимыми; каждое последующее значение в той или иной степени зависит от предыдущих.

Центральным понятием в анализе временных рядов является стационарность. Стационарный временной ряд — это такой ряд, статистические характеристики которого (например, среднее значение, дисперсия и автокорреляционная функция) остаются неизменными во времени. Другими словами, для стационарного ряда нет тренда, сезонности или других систематических изменений. Важность стационарности переоценить сложно: большинство теоретических результатов и методов моделирования, включая АРПСС, разработаны для стационарных рядов. Если ряд нестационарен, его необходимо привести к стационарному виду, чаще всего путем дифференцирования, о чем мы поговорим позднее. Какой же важный нюанс здесь упускается? То, что многие реальные временные ряды изначально нестационарны, и игнорирование этого факта приведет к неверным выводам и неточным прогнозам.

Обзор моделей АР, СС и АРСС

В основе моделей АРПСС лежат три фундаментальных компонента: авторегрессия, скользящее среднее и интегрирование. Давайте рассмотрим первые два.

Модель авторегрессии порядка p (АР(p)) описывает текущее значение временного ряда (Yt) как линейную комбинацию его p предыдущих значений и случайного белого шума. Интуитивно это означает, что будущее значение ряда можно предсказать, глядя на его недавнее прошлое. Математически модель АР(p) выражается следующим уравнением:

Yt = c + εt + Σpi=1 αiYt-i

Здесь:

  • Yt — текущее значение ряда.
  • c — константа (смещение).
  • εt — белый шум, представляющий собой случайные, необъяснимые флуктуации.
  • αi — авторегрессионные коэффициенты, определяющие влияние прошлых значений Y на текущее.
  • Yt-i — значения ряда в предыдущие моменты времени (лаги).

Модель скользящего среднего порядка q (СС(q)), в отличие от АР, фокусируется не на прошлых значениях самого ряда, а на прошлых ошибках прогнозирования (белом шуме). Она представляет текущее значение ряда как линейную комбинацию текущего и q прошлых значений белого шума. Это означает, что текущее отклонение от среднего значения ряда объясняется накопленными случайными шоками. Уравнение модели СС(q) имеет вид:

Yt = μ + εt + Σqi=1 βiεt-i

Где:

  • μ — среднее значение ряда.
  • εt — текущее значение белого шума.
  • βi — коэффициенты скользящего среднего, определяющие влияние прошлых ошибок ε на текущее Y.
  • εt-i — прошлые значения белого шума (ошибки).

Когда мы объединяем эти две концепции, получаем модель авторегрессии-скользящего среднего порядка (p, q), или АРСС(p, q). Эта модель описывает стационарный временной ряд как комбинацию его прошлых значений и прошлых ошибок прогнозирования, предлагая более гибкий и мощный инструмент для моделирования.

Модель АРПСС (ARIMA) для нестационарных рядов

Как было сказано, большинство моделей временных рядов требуют стационарности. Но что делать, если временной ряд имеет явный тренд (постоянное возрастание или убывание) или сезонность (регулярные колебания)? Здесь на помощь приходит компонент «интегрирования» (I), который превращает модель АРСС в модель АРПСС (ARIMA — Autoregressive Integrated Moving Average).

Интегрирование — это процесс дифференцирования, то есть взятия разностей между последовательными наблюдениями ряда, чтобы устранить тренд или сезонность и привести его к стационарному виду. Например, если мы возьмем разность первого порядка (Yt — Yt-1), мы можем устранить линейный тренд. Порядок интегрирования d указывает, сколько раз необходимо дифференцировать ряд для достижения стационарности.

Общее уравнение модели АРПСС(p, d, q) выглядит следующим образом:

Xt = c + εt + Σpi=1 αiXt-i + Σqi=1 βiεt-i

Где Xt — это уже дифференцированный (стационарный) временной ряд. Таким образом, АРПСС(p, d, q) — это модель АРСС(p, q), примененная к дифференцированному d раз ряду. Такой подход позволяет нам анализировать и прогнозировать даже те временные ряды, которые на первый взгляд кажутся хаотичными и не поддающимися моделированию. И что из этого следует? Это значит, что, используя интегрирование, мы расширяем применимость мощных методов АРСС на значительно более широкий класс реальных данных, делая их пригодными для анализа даже в сложных динамических системах.

Теоретические основы и математический аппарат моделей АРПСС

Понимание глубинных математических принципов, лежащих в основе моделей АРПСС, является ключом к их эффективному применению. От строгих уравнений до тонкостей определения белого шума — каждый элемент играет свою роль в формировании адекватного представления о динамике временного ряда.

Математические формулы моделей АР(p) и СС(q)

Давайте еще раз внимательно рассмотрим математическое выражение каждой из базовых моделей, углубляясь в смысл каждого элемента.

Модель авторегрессии АР(p):

Yt = c + εt + Σpi=1 αiYt-i

  • Yt: Представляет собой текущее значение временного ряда в момент времени t. Это та переменная, которую мы пытаемся смоделировать и прогнозировать.
  • c: Константа или среднее значение процесса (если ряд центрирован). Она отражает базовый уровень ряда, вокруг которого происходят колебания.
  • εt: Член ошибки, или белый шум в момент времени t. Это непредсказуемая, случайная компонента, которая не может быть объяснена прошлыми значениями ряда. Важно, что εt считается независимым и одинаково распределенным (i.i.d.) с нулевым средним и постоянной дисперсией.
  • Σpi=1 αiYt-i: Сумма авторегрессионных членов. Здесь αi — это авторегрессионные коэффициенты, которые показывают, насколько сильно значение Yt-i (значение ряда i периодов назад) влияет на текущее значение Yt. Порядок p указывает количество прошлых значений, используемых в модели.

Модель скользящего среднего СС(q):

Yt = μ + εt + Σqi=1 βiεt-i

  • Yt: Аналогично, текущее значение временного ряда в момент t.
  • μ: Среднее значение временного ряда. В отличие от константы c в АР-модели, здесь μ является прямым средним значением ряда, если он стационарен.
  • εt: Текущий член белого шума.
  • Σqi=1 βiεt-i: Сумма членов скользящего среднего. Здесь βi — это коэффициенты скользящего среднего, которые измеряют влияние прошлых случайных шоков (ошибок εt-i) на текущее значение ряда Yt. Порядок q указывает количество прошлых ошибок, включенных в модель.

Описание белого шума

Понятие белого шума (white noise) является фундаментальным для понимания моделей временных рядов. Это не просто «случайная ошибка», а строго определенная последовательность. Белый шум (εt) представляет собой последовательность независимых и одинаково распределенных случайных величин с нулевым средним и постоянной дисперсией, не имеющих автокорреляции.
Его ключевые характеристики:

  1. Нулевое среднее: E[εt] = 0 для всех t. Это означает, что в среднем ошибки не смещены.
  2. Постоянная дисперсия (гомоскедастичность): Var[εt] = σ2 для всех t. Это гарантирует, что изменчивость ошибок остается стабильной во времени.
  3. Отсутствие автокорреляции: Cov[εt, εt-k] = 0 для всех k ≠ 0. Это критически важно: ошибки в разные моменты времени совершенно независимы друг от друга. Если бы автокорреляция присутствовала, это означало бы, что часть информации в ошибках осталась необъясненной моделью, что противоречит идее оптимального моделирования.

Иногда предполагается, что белый шум также имеет нормальное распределение (такой шум называют гауссовским белым шумом), но для базовых определений моделей АРСС это не является строгим требованием, хотя и часто используется на практике для упрощения математического аппарата и применения метода максимального правдоподобия.

Общее уравнение АРСС(p, q)

Когда мы объединяем компоненты авторегрессии и скользящего среднего, получаем модель АРСС(p, q). Эта модель является более гибкой и способна описывать широкий спектр стационарных временных рядов.

Ее общее уравнение выглядит так:

Xt = c + εt + Σpi=1 αiXt-i + Σqi=1 βiεt-i

В этой формуле:

  • Xt: Текущее значение стационарного временного ряда. Если ряд был нестационарен, то Xt представляет собой дифференцированный ряд.
  • p: Порядок авторегрессионной части. Он указывает, сколько прошлых значений ряда (Xt-i) используются для прогнозирования текущего значения.
  • q: Порядок части скользящего среднего. Он указывает, сколько прошлых ошибок прогнозирования (εt-i) используются для прогнозирования текущего значения.

По сути, АРСС(p, q) говорит нам, что текущее значение ряда зависит как от его собственной истории (через авторегрессионные члены), так и от истории случайных шоков или ошибок (через члены скользящего среднего). Эта комбинация делает модель мощным инструментом для улавливания сложных зависимостей во временных рядах, позволяя более точно моделировать и прогнозировать их поведение.

Методология Бокса-Дженкинса: Систематический подход к моделированию

Методология Бокса-Дженкинса, разработанная Джорджем Боксом и Гвиллимом Дженкинсом, представляет собой систематический и итеративный подход к построению моделей АРПСС для прогнозирования временных рядов. Этот подход обеспечивает структурированный путь от первичного анализа данных до финальной диагностической проверки модели.

Этапы методологии Бокса-Дженкинса

Методология Бокса-Дженкинса включает четыре основных этапа, которые часто повторяются в итерационном цикле для достижения оптимальной модели:

  1. Идентификация модели (Identification): На этом этапе определяется подходящий порядок (p, d, q) для модели АРПСС. Это делается путем анализа автокорреляционной функции (АКФ) и частной автокорреляционной функции (ЧАКФ) временного ряда. Сначала проверяется стационарность ряда; при необходимости он дифференцируется для достижения стационарности, что определяет порядок d. Затем АКФ и ЧАКФ помогают определить порядки авторегрессионной (p) и скользящего среднего (q) компонент.
  2. Оценивание параметров модели (Estimation): После того как структура модели (p, d, q) определена, следующим шагом является оценка ее коэффициентов (αi и βi). Для этого используются статистические методы, такие как метод максимального правдоподобия или метод наименьших квадратов, которые позволяют найти значения параметров, наилучшим образом соответствующие наблюдаемым данным.
  3. Диагностика построенной модели (Diagnostic Checking): Этот критически важный этап направлен на проверку адекватности построенной модели. Основная задача — убедиться, что остатки модели (разница между фактическими и предсказанными значениями) ведут себя как белый шум. Если остатки содержат какую-либо структуру (например, автокорреляцию), это означает, что модель не полностью объясняет данные, и необходимо вернуться к этапу идентификации для ее уточнения. Проверяется также нормальность распределения остатков.
  4. Использование модели для прогнозирования (Forecasting): Если модель прошла все диагностические проверки и признана адекватной, ее можно использовать для прогнозирования будущих значений временного ряда. Прогнозы обычно сопровождаются доверительными интервалами, которые указывают на неопределенность предсказаний.

Этот процесс является итерационным: если диагностика показывает, что модель неадекватна, исследователю следует вернуться к этапу идентификации, внести корректировки в порядки (p, d, q) или рассмотреть альтернативные модели, а затем повторить все последующие шаги.

Предварительный анализ временного ряда

Прежде чем приступить к построению модели АРПСС, необходимо провести тщательный предварительный анализ временного ряда. Этот этап позволяет выявить основные характеристики ряда и подготовить его к моделированию.

  1. Визуальный анализ графика ряда: Первый и самый простой шаг — построение графика временного ряда. Это позволяет визуально обнаружить наличие тренда (долгосрочного увеличения или уменьшения), сезонности (регулярных повторяющихся паттернов), структурных изменений или выбросов. Например, график ежедневных продаж мороженого будет демонстрировать сезонность с пиками летом и спадами зимой.
  2. Проверка на стационарность: Визуальный анализ также помогает оценить стационарность. Если график показывает явный тренд или меняющуюся дисперсию, ряд, вероятно, нестационарен. Формальные тесты на стационарность (например, тест Дики-Фуллера) могут подтвердить эти наблюдения.
  3. Дифференцирование для достижения стационарности: Если ряд нестационарен, его необходимо трансформировать. Наиболее распространенный метод — это дифференцирование, то есть взятие разностей между соседними значениями.
    • Разность первого порядка: Xt = Yt — Yt-1. Используется для устранения линейного тренда.
    • Сезонная разность: Xt = Yt — Yk, где k — длина сезонного периода. Используется для устранения сезонности.

    После дифференцирования полученный ряд Xt снова проверяется на стационарность. Процесс повторяется до тех пор, пока ряд не станет стационарным, что и определяет порядок интегрирования d в модели АРПСС(p, d, q).

Идентификация порядка модели (p, d, q) с использованием АКФ и ЧАКФ

Определение подходящих порядков p, d и q является ключевым моментом в методологии Бокса-Дженкинса. Порядок интегрирования d определяется на этапе приведения ряда к стационарности. Для определения порядков p и q используются автокорреляционная функция (АКФ) и частная автокорреляционная функция (ЧАКФ).

  • Автокорреляционная функция (АКФ) измеряет степень линейной статистической связи между значениями временного ряда и его сдвинутой копией (с разным лагом). График АКФ, называемый коррелограммой, показывает, насколько текущее значение ряда коррелирует с его значениями в прошлом. Для стационарного ряда АКФ быстро убывает к нулю. При наличии тренда АКФ будет медленно убывать, а при наличии сезонности будут наблюдаться значимые пики на лагах, соответствующих сезонным периодам.
  • Частная автокорреляционная функция (ЧАКФ) показывает «чистую» корреляцию между текущим значением ряда и значением с определенным лагом, исключая влияние всех промежуточных значений. То есть, ЧАКФ на лаге k измеряет корреляцию между Xt и Xt-k, очищенную от влияния Xt-1, …, Xt-k+1.

Правила идентификации порядка модели с помощью АКФ и ЧАКФ:

Для определения значимости коэффициентов автокорреляции на коррелограммах (графиках АКФ и ЧАКФ) используются доверительные интервалы, которые обычно отображаются в виде двух стандартных ошибок коэффициентов автокорреляции. Коэффициенты, выходящие за эти границы, считаются статистически значимыми.

  1. Для модели АР(p):
    • ЧАКФ быстро убывает до нуля после лага p. Это означает, что значимыми будут p первых значений ЧАКФ, а последующие — незначимы.
    • АКФ убывает экспоненциально или синусоидально, но не обрывается резко.
  2. Для модели СС(q):
    • АКФ быстро убывает до нуля после лага q. То есть, значимыми будут q первых значений АКФ, а последующие — незначимы.
    • ЧАКФ убывает экспоненциально или синусоидально.
  3. Для смешанной модели АРСС(p, q):
    • И АКФ, и ЧАКФ убывают экспоненциально или синусоидально, не демонстрируя резкого обрыва после определенного лага. Это указывает на наличие как авторегрессионной, так и скользящего среднего компонента.

Визуальный анализ коррелограмм, дополненный численными значениями коэффициентов и их стандартными ошибками, позволяет опытным путем определить наиболее вероятные порядки p и q, с которых следует начинать оценивание модели. При наличии в ряду тенденции (тренда) коррелограмма АКФ имеет максимум при лаге L=1 и линейно убывает, а при наличии циклической компоненты с периодом k выраженный максимум АКФ наблюдается для лага L=k. Быстрое убывание значений выборочной АКФ (и ЧАКФ) является простым критерием стационарности ряда.

Инструментарий для моделирования: MathCAD и STATISTICA

Эффективное моделирование временных рядов требует не только глубокого теоретического понимания, но и владения соответствующими программными инструментами. В этом разделе мы рассмотрим, как MathCAD может быть использован для формирования временных рядов и как STATISTICA позволяет реализовать методологию Бокса-Дженкинса, уделяя особое внимание решению практических задач.

Формирование временных рядов по моделям АР/СС в MathCAD

MathCAD, как мощная система компьютерной математики, предоставляет широкие возможности для статистических расчетов, хотя и не содержит специализированных «волшебных кнопок» для автоматической генерации сложных моделей АРПСС. Однако его гибкость позволяет пользователям вручную реализовать эти модели, что является бесценным опытом для глубокого понимания внутренних механизмов.

Пошаговая инструкция по ручной реализации моделей АР(p) и СС(q) в MathCAD:

  1. Определение начальных условий и параметров модели:
    • Выбираем порядки p и q (например, для АР(1) это p=1, для СС(1) это q=1).
    • Задаем авторегрессионные коэффициенты αi и/или коэффициенты скользящего среднего βi. Например, для АР(1) можно взять α1 = 0.5. Для СС(1) — β1 = 0.3.
    • Определяем константу c или среднее μ.
    • Задаем начальное значение ряда Y0 (для АР-моделей) или начальные значения ошибок ε0 (для СС-моделей).
  2. Генерация случайного белого шума:
    • Для моделирования белого шума, который часто предполагается нормально распределенным, MathCAD предлагает функцию rnorm(m, μ, σ). Здесь m — количество генерируемых случайных чисел, μ — среднее (для белого шума оно равно 0), σ — стандартное отклонение (дисперсия). Например, для генерации 100 значений белого шума со стандартным отклонением 1, используем epsilon := rnorm(100, 0, 1).
    • Альтернативно, можно использовать runif(m, a, b) для генерации равномерно распределенного шума, если это соответствует предположениям о процессе.
  3. Построение рекуррентных формул:
    • Для модели АР(1):
      • Задаем Y[0] := 10 (начальное значение).
      • Задаем c := 0.
      • Задаем alpha_1 := 0.5.
      • Генерируем epsilon := rnorm(N, 0, 1) для N шагов.
      • Пишем рекуррентную формулу: Y[t] := c + epsilon[t] + alpha_1 * Y[t-1] для t = 1 .. N-1.
    • Для модели СС(1):
      • Задаем mu := 10.
      • Задаем beta_1 := 0.3.
      • Генерируем epsilon := rnorm(N, 0, 1) для N шагов.
      • Пишем рекуррентную формулу: Y[t] := mu + epsilon[t] + beta_1 * epsilon[t-1] для t = 1 .. N-1.
      • Важно: для epsilon[0] (если t=1) можно принять его равным 0 или сгенерировать отдельно.
  4. Визуализация и анализ: После генерации ряда можно построить его график, а также вычислить выборочные АКФ и ЧАКФ (в MathCAD для этого могут потребоваться пользовательские функции или дополнительные пакеты, или экспорт в STATISTICA).

Таким образом, MathCAD, хоть и требует более ручного подхода, позволяет глубоко понять механизм работы моделей АР и СС, что бесценно для образовательного процесса. Каков же важный нюанс здесь упускается? То, что ручная реализация значительно повышает понимание внутренней логики алгоритмов, но может быть трудоемкой для сложных моделей и больших объемов данных.

Работа с данными: импорт, экспорт и обработка пропущенных значений

Эффективный анализ временных рядов зачастую требует перемещения данных между различными программными пакетами. Между MathCAD и STATISTICA нет прямого специализированного интерфейса для обмена данными, поэтому приходится использовать универсальные промежуточные форматы.

Импорт данных в MathCAD:
MathCAD поддерживает импорт данных из различных источников.

  • Текстовые файлы (Delimited Text, TXT, CSV): Используйте «Мастер импорта данных» (Data Import Wizard). Это наиболее универсальный способ. Важно убедиться, что десятичный разделитель (точка или запятая) и кодировка файла соответствуют настройкам MathCAD.
  • Файлы Microsoft Excel (XLS/XLSX): MathCAD может импортировать данные напрямую из файлов Excel, что удобно, если исходные данные хранятся в табличном формате.

Экспорт данных из MathCAD:
Для экспорта данных из MathCAD в форматы, пригодные для STATISTICA, чаще всего используются:

  • Текстовые файлы (TXT, CSV): Сохранение числовых массивов в текстовом формате с разделителями (например, запятыми или точками с запятой) — универсальный способ.
  • Файлы Microsoft Excel: MathCAD может экспортировать данные в Excel, что также обеспечивает хорошую совместимость.

Импорт данных в STATISTICA:
STATISTICA обладает широкими возможностями для импорта данных:

  • Текстовые файлы (TXT, CSV): Через меню «Файл» → «Открыть» или «Импортировать данные» можно выбрать текстовые файлы. Интерфейс позволяет настроить разделители, кодировку и формат данных.
  • Файлы Microsoft Excel (XLS/XLSX): Прямой импорт из Excel является стандартной функцией.

Проблемы совместимости форматов:
На практике часто возникают проблемы, связанные с региональными настройками:

  • Десятичные разделители: В некоторых странах (включая Россию) используется запятая в качестве десятичного разделителя, тогда как в англоязычных странах — точка. При импорте из одного ПО в другое это может привести к некорректной интерпретации чисел. Необходимо вручную изменить разделитель в файле или указать правильный разделитель в мастере импорта.
  • Кодировки: Проблемы с кодировкой (например, UTF-8, Windows-1251) могут привести к некорректному отображению русских символов в заголовках столбцов или текстовых полях.

Обработка пропущенных значений в STATISTICA:
Пропущенные данные — обычное явление во временных рядах. STATISTICA предлагает ряд функций для их обработки:

  • Идентификация пропущенных данных: Программа позволяет легко находить пропущенные значения (обозначаются как NaN или пустым полем).
  • Методы замещения (импутации):
    • Удаление: Наиболее простой, но часто нежелательный метод, при котором наблюдения с пропущенными значениями просто удаляются. Не рекомендуется для временных рядов, так как нарушает структуру последовательности.
    • Заполнение средним/медианой/модой: Пропущенное значение заменяется средним, медианой или модой соответствующего столбца.
    • Интерполяция:
      • Линейная интерполяция: Пропущенное значение рассчитывается как среднее между ближайшими известными значениями до и после.
      • Интерполяция по ближайшим точкам: Замещение пропущенного значения ближайшим известным значением.
      • Интерполяция с использованием регрессии: Построение регрессионной модели для прогнозирования пропущенных значений на основе других переменных.
    • Экстраполяция: Прогнозирование пропущенных значений на основе предшествующих или последующих данных.

Оптимальный объем выборки:
Для надежного применения моделей Бокса-Дженкинса и обеспечения хотя бы относительной точности модели рекомендуется иметь не менее 50 наблюдений. Однако на практике часто фиксируется более 100 результатов наблюдений для повышения надежности прогнозов. Для временных рядов, например, ARIMA-модели рекомендуют применять для данных от трех лет, чтобы учесть возможные сезонные и циклические компоненты.

Построение моделей АРПСС в STATISTICA: пошаговое руководство

STATISTICA является мощным инструментом для анализа временных рядов, реализующим методологию Бокса-Дженкинса. Она предоставляет интуитивно понятный интерфейс для всех этапов моделирования.

Подробное описание использования модуля «Time Series/Forecasting» в STATISTICA:

  1. Загрузка данных:
    • Откройте STATISTICA и загрузите исходные данные в рабочую книгу (например, из CSV или Excel). Убедитесь, что временной ряд представлен в одном столбце.
  2. Доступ к модулю анализа временных рядов:
    • Перейдите в меню «Дополнительные» (Advanced Models) → «Модели» → «Прогноз/серия времени» (Time Series/Forecasting).
  3. Предварительный анализ и подготовка:
    • В диалоговом окне «Time Series Analysis» сначала перейдите на вкладку «Переменные» (Variables) и выберите ваш временной ряд.
    • На вкладке «Графики» (Plots) постройте график ряда для визуального анализа тренда и сезонности.
    • Если ряд нестационарен, необходимо его дифференцировать. Это можно сделать на вкладке «Преобразования» (Transformations) или непосредственно в диалоге моделирования АРПСС, задав порядок интегрирования d.
  4. Идентификация порядка модели (p, d, q):
    • Перейдите на вкладку «Автокорреляции» (Autocorrelations). Здесь вы можете получить коррелограмму (графики АКФ и ЧАКФ) временного ряда.
    • Внимательно проанализируйте коррелограммы, чтобы определить потенциальные порядки p и q в соответствии с правилами, описанными ранее (резкий обрыв ЧАКФ для АР, резкий обрыв АКФ для СС).
  5. Настройка и оценивание модели АРПСС:
    • Перейдите на вкладку «АРПСС и автокорреляционные функции» (ARIMA & autocorrelations).
    • В полях «Порядок АР» (AR Order), «Порядок интегрирования» (Differencing Order) и «Порядок СС» (MA Order) введите предполагаемые значения p, d и q.
    • Нажмите кнопку «Оценить модель» (Estimate Model). STATISTICA выполнит оценивание параметров модели.
  6. Диагностика модели:
    • После оценивания перейдите на вкладку «Остатки» (Residuals) или «Диагностика» (Diagnostics).
    • Проверьте остатки на автокорреляцию с помощью теста Льюнга-Бокса (Ljung-Box Q-test), который обычно отображается в результатах.
    • Проверьте нормальность распределения остатков. STATISTICA может предоставить гистограмму остатков и результаты статистических тестов на нормальность.
    • Если модель неадекватна (остатки не ведут себя как белый шум), вернитесь к этапу идентификации и попробуйте другие порядки p и q, возможно, используя информационные критерии AIC и BIC для сравнения моделей.
  7. Прогнозирование:
    • Если модель признана адекватной, перейдите на вкладку «Прогноз» (Forecast).
    • Задайте горизонт прогнозирования (количество шагов вперед).
    • Нажмите «Прогнозировать» (Forecast). STATISTICA сгенерирует прогнозные значения и доверительные интервалы.
    • На вкладке «Графики» можно построить график ряда с добавленными прогнозами и доверительными интервалами.

Этот пошаговый процесс позволяет систематически строить и проверять модели АРПСС, превращая сложную аналитическую задачу в последовательность выполнимых шагов в специализированном программном обеспечении.

Оценивание параметров и диагностика модели

После того как структура модели АРПСС определена, следующим критически важным шагом является точное определение ее внутренних параметров. Этот процесс, известный как оценивание, сопровождается тщательной диагностикой, которая позволяет убедиться в адекватности построенной модели.

Методы оценивания параметров (МНК, максимального правдоподобия)

Оценивание параметров временных рядов — это процесс определения коэффициентов (например, αi и βi для моделей АРСС), которые наилучшим образом описывают наблюдаемый временной ряд. Для этого используются различные статистические методы, каждый из которых имеет свои теоретические основы и область применения.

  1. Метод максимального правдоподобия (Maximum Likelihood Estimation, MLE):
    • Теоретические основы: Метод максимального правдоподобия является одним из наиболее мощных и широко используемых методов в статистике. Он предполагает, что наблюдаемые данные генерируются из некоторого вероятностного распределения (например, нормального распределения для ошибок), параметры которого неизвестны. Цель MLE — найти такие значения параметров, при которых вероятность (правдоподобие) наблюдения имеющихся данных максимальна.
    • Применение в STATISTICA: Большинство современных статистических пакетов, включая STATISTICA, используют метод максимального правдоподобия для оценивания параметров моделей АРПСС. Это особенно эффективно, когда ошибки (εt) предполагаются нормально распределенными, что часто является стандартным предположением. MLE дает асимптотически эффективные, состоятельные и несмещенные оценки параметров.
  2. Метод наименьших квадратов (Ordinary Least Squares, OLS):
    • Теоретические основы: Метод наименьших квадратов является базовым методом регрессионного анализа. Его основная идея заключается в минимизации суммы квадратов отклонений между наблюдаемыми (фактическими) значениями временного ряда и значениями, предсказанными моделью. Цель — найти такие параметры, которые минимизируют Σ(yi - ŷi)2, где yi — фактические значения, а ŷi — предсказанные моделью.
    • Применение в контексте временных рядов: Хотя МНК является простым и интуитивно понятным, его прямое применение к автокоррелированным временным рядам может привести к смещенным и неэффективным оценкам параметров. Это связано с нарушением одного из ключевых допущений МНК — отсутствия автокорреляции остатков. Поэтому в моделях АРСС часто применяются модифицированные версии МНК или метод максимального правдоподобия, который более устойчив к таким проблемам. Однако для чисто авторегрессионных моделей (АР(p)) МНК может быть вполне применим при определенных условиях.

Оба метода стремятся найти «лучшие» параметры, но подход к определению «лучших» различается: MLE ищет параметры, максимально согласующиеся с вероятностным распределением данных, а OLS — параметры, минимизирующие сумму квадратов ошибок.

Диагностика остатков: проверка на автокорреляцию и нормальность

После оценивания параметров модели крайне важно провести ее диагностику, чтобы убедиться в адекватности и корректности построенной модели. Основная задача — проверить, являются ли остатки модели (разница между наблюдаемыми и предсказанными значениями) истинным белым шумом. Если остатки демонстрируют какую-либо структуру, это указывает на то, что модель не полностью уловила все зависимости в исходном временном ряду.

  1. Проверка на автокорреляцию остатков: Q-тест Льюнга-Бокса
    • Назначение: Тест Льюнга-Бокса (Ljung-Box Q-test) является статистическим критерием для выявления автокоррелированности остатков временного ряда. Это ключевой инструмент для проверки гипотезы о том, что остатки модели АРПСС не содержат какой-либо структуры.
    • Нулевая гипотеза (H0): Отсчеты временного ряда (в данном случае, остатки модели) статистически независимы, то есть все коэффициенты автокорреляции равны нулю.
    • Альтернативная гипотеза (H1): Отсчеты временного ряда не являются независимыми; существует значимая автокорреляция.
    • Интерпретация: Если p-значение (p-value) теста Льюнга-Бокса больше выбранного уровня значимости (например, 0.05), то мы не можем отвергнуть нулевую гипотезу. Это означает, что остатки не содержат значимой автокорреляции и ведут себя как белый шум, что подтверждает адекватность модели. Если p-значение меньше уровня значимости, это указывает на наличие автокорреляции в остатках, что требует пересмотра модели (например, изменения порядков p или q).
    • Формула: Статистика Q-теста Льюнга-Бокса рассчитывается как:
      Q = N(N + 2) Σhk=1 (ρ̂2k / (N - k))
      Где:

      • N — количество наблюдений в временном ряду.
      • h — максимальный лаг, для которого проверяется автокорреляция.
      • ρ̂k — выборочный коэффициент автокорреляции остатков на лаге k.
  2. Проверка на нормальность распределения остатков
    • Назначение: Многие статистические методы, включая метод максимального правдоподобия для оценивания параметров АРПСС, предполагают нормальное распределение ошибок. Проверка нормальности остатков позволяет убедиться, что это предположение не нарушено.
    • Критерии нормальности: В STATISTICA и других пакетах реализованы различные критерии:
      • Критерий Шапиро-Уилка: Один из наиболее мощных тестов для проверки нормальности при малых выборках (обычно до 5000 наблюдений).
      • Критерий Колмогорова-Смирнова (с поправкой Лиллиефорса): Используется для проверки того, что выборка принадлежит к определенному распределению (в данном случае, нормальному).
      • Критерии асимметрии и эксцесса: Позволяют оценить форму распределения остатков. Для нормального распределения асимметрия и эксцесс должны быть близки к нулю.
      • Критерий Айвазяна и хи-квадрат: Также используются для проверки нормальности, особенно для больших выборок.
    • Интерпретация: Если p-значение теста на нормальность больше уровня значимости (например, 0.05), то мы не отвергаем нулевую гипотезу о нормальном распределении остатков. Визуально нормальность можно оценить по гистограмме остатков (должна быть колоколообразной формы) и по графику квантиль-квантиль (QQ-plot), где точки должны ложиться примерно на прямую линию.

Неудовлетворительные результаты диагностики (наличие автокорреляции или отклонение от нормальности) сигнализируют о необходимости пересмотра модели, возможно, путем изменения порядков p, d, q, или рассмотрения более сложных моделей. Это подводит нас к важному вопросу: как выбрать лучшую модель среди множества возможных вариантов, если диагностики все равно показывают неидеальные результаты?

Критерии выбора порядка моделей (AIC, BIC)

Выбор подходящих порядков p (авторегрессии), d (интегрирования) и q (скользящего среднего) в модели АРПСС является итеративным процессом. Помимо анализа АКФ и ЧАКФ, существенную помощь оказывают информационные критерии, которые позволяют объективно сравнивать различные модели.

  1. Информационный критерий Акаике (Akaike Information Criterion, AIC):
    • Назначение: AIC используется для выбора наилучшей модели среди нескольких кандидатов. Он пытается найти баланс между точностью подгонки модели к данным и ее сложностью (количеством параметров).
    • Принцип: AIC штрафует модели с большим количеством параметров, чтобы избежать переобучения. Чем меньше значение AIC, тем лучше модель.
    • Формула (общий вид): AIC = -2 ⋅ log(L) + 2 ⋅ k
      Где:

      • L — максимальное значение функции правдоподобия для модели.
      • k — количество параметров в модели.
    • Интерпретация: При сравнении нескольких моделей АРПСС выбирается та, у которой значение AIC минимально.
  2. Байесовский информационный критерий (Bayesian Information Criterion, BIC), также известный как Schwarz Information Criterion (SIC):
    • Назначение: BIC, как и AIC, используется для выбора модели. Он также учитывает как качество подгонки, так и сложность модели, но налагает более строгий штраф за увеличение количества параметров, особенно при больших объемах данных.
    • Принцип: BIC стремится выбрать более простую модель, которая при этом хорошо объясняет данные. Чем меньше значение BIC, тем лучше модель.
    • Формула (общий вид): BIC = -2 ⋅ log(L) + k ⋅ log(N)
      Где:

      • L — максимальное значение функции правдоподобия для модели.
      • k — количество параметров в модели.
      • N — количество наблюдений (размер выборки).
    • Интерпретация: При сравнении нескольких моделей АРПСС выбирается та, у которой значение BIC минимально. Из-за более сильного штрафа за число параметров, BIC чаще склоняется к выбору более простых моделей, чем AIC.

Применение на практике:
Обычно начинают с небольших значений p и q (например, от 0 до 3) и постепенно увеличивают их, наблюдая за изменениями в АКФ и ЧАКФ остатков и значениями информационных критериев. Исследователь может оценить несколько моделей с разными порядками (например, АРПСС(1,1,0), АРПСС(0,1,1), АРПСС(1,1,1)) и выбрать ту, у которой наименьшие значения AIC и/или BIC. Этот итерационный процесс, сочетающий визуальный анализ коррелограмм с объективными критериями, позволяет прийти к наиболее адекватной и экономичной модели.

Прогнозирование и оценка его эффективности

Кульминацией работы с моделями временных рядов является прогнозирование — предсказание будущих значений на основе построенной модели. Однако сам прогноз имеет ценность лишь в той степени, в какой мы можем оценить его точность и надежность.

Прогнозирование с использованием моделей АРПСС

Модели АРПСС (Autoregressive Integrated Moving Average) являются мощным инструментом для предсказания будущих значений временного ряда. Их способность учитывать автокорреляцию (зависимость от прошлых значений) и интегрированность (наличие тренда, устраненного дифференцированием) делает их особенно ценными для прогнозирования состояния динамических объектов.

Как происходит прогнозирование:

  1. Построение и диагностика модели: Сначала необходимо построить адекватную модель АРПСС(p, d, q) и убедиться в ее состоятельности с помощью описанных ранее диагностических тестов (проверка остатков на белый шум и нормальность).
  2. Шаг вперед (одношаговый прогноз): Для получения прогноза на один шаг вперед (Yt+1) модель использует фактические значения ряда до момента t (Yt, Yt-1, …), а также оцененные ошибки прогнозирования (εt, εt-1, …).
    • Например, для АР(1) модели Yt = c + α1Yt-1 + εt, прогноз на следующий шаг будет: Ŷt+1 = c + α1Yt. Здесь εt+1 предполагается равным нулю, так как это непредсказуемый белый шум.
  3. Многошаговый прогноз: Для прогнозирования на несколько шагов вперед (Yt+2, Yt+3 и т.д.) модель начинает использовать свои собственные предыдущие прогнозы вместо фактических значений, которые еще неизвестны. Это приводит к увеличению неопределенности и расширению доверительных интервалов по мере увеличения горизонта прогнозирования.
    • Например, для прогноза Ŷt+2 в АР(1) модели, используется уже спрогнозированное Ŷt+1: Ŷt+2 = c + α1Ŷt+1.

Эффективность прогнозирования:

  • Краткосрочные прогнозы: Модели АРПСС особенно эффективны для краткосрочных прогнозов, когда горизонт предсказания составляет от одного до нескольких периодов вперед. Они хорошо улавливают краткосрочные зависимости и инерцию системы. Например, для прогноза энергопотребления ошибка (MAPE) обычно колеблется от 1 до 5%.
  • Долгосрочные прогнозы: Для долгосрочных прогнозов (на десятки и более периодов), особенно в условиях выраженных трендов и циклов, АРПСС-модели могут быть менее эффективными. В этом случае доверительные интервалы становятся очень широкими, что свидетельствует о высокой неопределенности. Для таких задач могут потребоваться другие подходы или более сложные модели, учитывающие долгосрочные структурные изменения. Для более волатильных рядов, таких как цены на электроэнергию, MAPE может составлять от 5 до 15%.
  • Динамический объект: Применительно к динамическим объектам, АРПСС-модели позволяют прогнозировать их состояние, например, будущую производительность оборудования, финансовые показатели компании или даже климатические параметры, исходя из наблюдаемой динамики.

Метрики оценки качества прогнозов

После того как прогноз сделан, необходимо объективно оценить его точность и надежность. Для этого используется набор статистических метрик, каждая из которых имеет свои особенности и область применения.

  1. Средняя квадратичная ошибка (Mean Squared Error, MSE):
    • Определение: MSE измеряет среднее значение квадратов разностей между прогнозируемыми (ŷi) и фактическими (yi) значениями.
    • Формула: MSE = (1/n) Σni=1 (yi - ŷi)2
    • Особенности: Придает больший вес крупным ошибкам, поскольку они возводятся в квадрат. Единицы измерения MSE являются квадратом единиц измерения исходного ряда, что затрудняет непосредственную интерпретацию. Чем ниже MSE, тем точнее прогноз.
  2. Средняя абсолютная ошибка (Mean Absolute Error, MAE):
    • Определение: MAE рассчитывается как среднее абсолютных разностей между целевыми (yi) и предсказанными (ŷi) значениями.
    • Формула: MAE = (1/n) Σni=1 |yi - ŷi|
    • Особенности: Менее чувствительна к выбросам по сравнению с MSE, так как не возводит ошибки в квадрат. Выражается в тех же единицах, что и исходный ряд, что облегчает интерпретацию. Чем ниже MAE, тем точнее прогноз.
  3. Корень из средней квадратичной ошибки (Root Mean Squared Error, RMSE):
    • Определение: RMSE является квадратным корнем из MSE.
    • Формула: RMSE = √MSE
    • Особенности: Выражается в тех же единицах, что и прогнозируемая величина, что значительно облегчает интерпретацию по сравнению с MSE. Широко используется для оценки точности прогнозов.
  4. Средняя абсолютная процентная ошибка (Mean Absolute Percentage Error, MAPE):
    • Определение: MAPE выражается в процентах и показывает среднее абсолютное процентное отклонение прогнозируемых значений от фактических.
    • Формула: MAPE = (1/n) Σni=1 (|yi - ŷi| / yi) ⋅ 100
    • Особенности: Полезна для сравнения моделей на разных масштабах данных, поскольку это относительная метрика.
    • Ограничения: Имеет существенные ограничения, если фактические значения yi близки к нулю, так как это может привести к делению на ноль или очень большим, нестабильным значениям MAPE. В таких случаях ее использование нецелесообразно.
  5. Средняя абсолютная масштабированная ошибка (Mean Absolute Scaled Error, MASE):
    • Определение: MASE предложена для устранения проблем MAPE с нулевыми значениями и обеспечения возможности сравнения прогнозов на разных временных рядах, независимо от их масштаба. MASE масштабирует абсолютную ошибку относительно средней абсолютной ошибки «наивной» модели (прогнозирование следующего значения как текущего).
    • Формула: MASE = (1/n) Σni=1 |yi - ŷi| / ((1/(n-1)) Σnt=2 |yt - yt-1|)
    • Особенности: Значение MASE меньше 1 указывает на то, что модель работает лучше, чем «наивный» прогноз. Значение больше 1 означает, что модель хуже наивного прогноза.

Дополнительные критерии выбора модели:
Помимо ошибок прогнозирования, для выбора наилучшей модели среди нескольких кандидатов часто используются уже упомянутые информационные критерии:

  • AIC (Akaike Information Criterion): Отдает предпочтение моделям, которые хорошо подходят к данным, но с меньшим числом параметров.
  • BIC (Bayesian Information Criterion): Налагает больший штраф за количество параметров, чем AIC, и часто выбирает более простые модели.

Выбор конкретной метрики зависит от контекста задачи и требований к прогнозу. Комплексный анализ этих метрик позволяет получить всестороннюю оценку качества и надежности построенных моделей АРПСС.

Заключение

В рамках данного руководства мы совершили погружение в мир анализа временных рядов, деконструировав и систематизировав подходы к построению и анализу вычислительных алгоритмов на примере моделей АРПСС. Мы начали с фундаментальных определений, таких как временной ряд и стационарность, и постепенно перешли к сложным концепциям авторегрессии, скользящего среднего и их интегрированных форм.

Были детально рассмотрены математические основы моделей АР, СС и АРСС, включая роль и характеристики белого шума, который является краеугольным камнем для их корректного применения. Особое внимание было уделено методологии Бокса-Дженкинса – систематическому четырехэтапному процессу идентификации, оценивания, диагностики и прогнозирования, который обеспечивает надежный путь к построению адекватных моделей.

Практическая часть руководства предоставила уникальные пошаговые инструкции по ручной реализации моделей АР и СС в MathCAD, что позволяет студентам получить глубокое интуитивное понимание их работы. Мы также подробно рассмотрели использование STATISTICA для комплексного анализа временных рядов, уделив особое внимание нюансам импорта/экспорта данных, преодолению проблем совместимости форматов и эффективной обработке пропущенных значений – «слепых зон», часто упускаемых в других источниках.

Критически важным блоком стала диагностика моделей, где мы глубоко изучили проверку остатков на автокорреляцию с помощью Q-теста Льюнга-Бокса и на нормальность распределения, а также рассмотрели применение информационных критериев AIC и BIC для выбора оптимальной структуры модели. Завершающий раздел был посвящен прогнозированию и всесторонней оценке его эффективности, где были представлены и подробно проанализированы ключевые метрики, такие как MSE, MAE, RMSE, MAPE и MASE, с указанием их сильных сторон и ограничений.

Комплексный подход к анализу временных рядов, сочетающий глубокие теоретические знания с практическим владением программными инструментами, является ключом к успешному моделированию и прогнозированию динамических процессов. Освоение методологии Бокса-Дженкинса и алгоритмов АРПСС открывает широкие возможности для применения в различных областях – от инженерии до экономики. В дальнейшем студентам и исследователям рекомендуется углубляться в изучение более сложных моделей (например, сезонных ARIMA, GARCH для моделирования волатильности), а также исследовать методы машинного обучения для анализа временных рядов, чтобы расширить свой аналитический инструментарий.

Список использованной литературы

  1. Анализ временных рядов Бокса-Дженкинса. URL: https://buklib.net/books/34947/
  2. Модель авторегрессии — скользящего среднего. URL: https://ru.wikipedia.org/wiki/Модель_авторегрессии_—_скользящего_среднего
  3. Модель Бокса-Дженкинса: Определение, использование, сроки и прогнозирование. URL: https://www.investopedia.com/terms/b/box-jenkins-model.asp
  4. Анализ временных рядов. URL: https://prognoz.com/analytics/time-series-analysis
  5. Модель авторегрессии и скользящего среднего (ARMA). URL: https://caseware.com.ua/blog/model-avtoregressii-i-skolzyashchego-srednego-arma/
  6. Методология Бокса-Дженкинса. URL: https://www.ibm.com/docs/ru/spss-statistics/27.0.1?topic=series-box-jenkins-methodology
  7. Временные ряды. URL: https://yandex.ru/support/education/lesson/8197/
  8. Введение в анализ временных рядов. URL: https://mse.msu.ru/wp-content/uploads/2020/03/lecture_timeseries.pdf
  9. Анализ временных рядов и прогнозирование. URL: https://www.osu.ru/sites/default/files/docs/2018/11/27/anaprognozt_ryadov.pdf
  10. Попова И. Н., Ковалев В. В. Анализ временных рядов. Москва: Юрайт, 2024.
  11. Choosing the best q and p from ACF and PACF plots in ARMA-type modeling. URL: https://www.baeldung.com/cs/acf-pacf-arma-model
  12. Модели ARIMA. URL: https://otl.miem.hse.ru/data/2015/09/20/1188544955/arima.pdf
  13. ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ. URL: https://www.hse.ru/data/2010/06/19/1218552175/lect_4.pdf
  14. Методы Бокса-Дженкинса (ARIMA). URL: https://www.machinelearningmastery.ru/arima-models-for-time-series-forecasting/
  15. В чём заключается метод Бокса-Дженкинса? URL: https://yandex.ru/search/touch/?text=Что+такое+порядок+модели+АР+или+СС%3F&clid=2270455&lr=213&redircnt=1700688640.1&reqenc=1&sa=X&web=1&serp-exp=31899%2C31901&text=В+чём+заключается+метод+Бокса-Дженкинса%3F
  16. Правила построения АРПСС-моделей. URL: https://www.ibm.com/docs/ru/spss-statistics/27.0.1?topic=series-arima-rules
  17. Анализ временных рядов. URL: https://habr.com/ru/articles/526786/
  18. Методика построения модели ARIMA для прогнозирования динамики временных рядов. URL: https://cyberleninka.ru/article/n/metodika-postroeniya-modeli-arima-dlya-prognozirovaniya-dinamiki-vremennyh-ryadov/viewer
  19. Модели вида ARIMA. URL: https://yandex.ru/support/education/lesson/8197/10_4.html
  20. Идентификация модели стационарного временного ряда. URL: https://studfile.net/preview/9431411/page:4/
  21. Что такое «порядок» модели АР или СС? URL: https://yandex.ru/search/touch/?text=Что+такое+порядок+модели+АР+или+СС%3F&clid=2270455&lr=213&redircnt=1700688640.1&reqenc=1&sa=X&web=1&serp-exp=31899%2C31901
  22. Анализ и прогнозирование временных рядов. URL: https://www.m-economy.ru/articles/125/
  23. Прогнозирование: Лекция 5. Методология Бокса-Дженкинса (модели ARIMA). URL: https://www.slideshare.net/secret/uM8I6x5q1Z7eYx
  24. Методология Box–Jenkins (BJ) или модели AR(I)MA. Модель авторегрессии AR(p). Модель авторегрессии MA(q). URL: https://www.machinelearningmastery.ru/box-jenkins-methodology-for-arima-models/
  25. Выбор порядка AR с частичной автокорреляционной последовательностью. URL: https://www.machinelearningmastery.ru/interpret-acf-and-pacf-plots-for-time-series-forecasting/
  26. Анализ временных рядов: от основ к моделям ARIMA Джорджа Бокса. URL: https://infostart.ru/public/1612745/
  27. Анализ временных рядов. URL: https://wikicon.ru/wiki/Анализ_временных_рядов
  28. Лекция по эконометрике №3, модуль 4 Временные ряды. URL: https://www.hse.ru/data/2010/06/19/1218552175/lect_3.pdf
  29. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Выпуск 1. Москва: Финансы и статистика, 1974.
  30. Прогнозирование временных рядов. URL: https://www.machinelearningmastery.ru/time-series-forecasting-methods-in-r/
  31. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Пер. с англ. Москва: Мир, 1974.
  32. Автокорреляция (ACF) и частичная автокорреляция (PACF) в биржевом анализе. URL: https://journal.open-broker.ru/investments/avtokorreljacija-acf-i-chastichnaja-avtokorreljacija-pacf-v-birzhevom-analize/
  33. Автокорреляционная функция. URL: https://ru.wikipedia.org/wiki/Автокорреляционная_функция
  34. Автокорреляционная функция (Autocorrelation function). URL: https://wiki.loginom.ru/doku.php?id=autocorrelation_function
  35. Этапы тренировки по боксу. Как проходят занятия боксом в нашей секции. URL: https://federation-boxing.ru/stati/etapy-trenirovki-po-boksu-kak-prohodyat-zanyatiya-boksom-v-nashej-sekcii/
  36. Тренировочный цикл боксера — этапы подготовки боксера. Клуб Ударник. Москва. URL: https://udarnik.com/articles/trenirovochnyj-cikl-boksera-etapy-podgotovki-boksera/
  37. Верификации прогнозов АРПСС-моделей временных рядов, применяемых для прогнозирования долговечности интегральных схем ИС. URL: https://cyberleninka.ru/article/n/verifikatsii-prognozov-arpss-modeley-vremennyh-ryadov-primenyaemyh-dlya-prognozirovaniya-dolgovechnosti-integralnyh-shem-is/viewer
  38. Применение метода АРПСС для построения прогноза электропотребления. URL: https://www.elibrary.ru/item.asp?id=26214157
  39. Приложения модели авторегрессии и проинтегрированного скользящего среднего (АРПСС) в экономических процессах. URL: https://fundamental-research.ru/ru/article/view?id=40078
  40. Как построить модель ARIMA в Statistica? URL: https://yandex.ru/search/touch/?text=Как+построить+модель+ARIMA+в+Statistica%3F&clid=2270455&lr=213&redircnt=1700688640.1&reqenc=1&sa=X&web=1&serp-exp=31899%2C31901
  41. Построение модели временного ряда ARIMA в программе Statistica. URL: https://www.youtube.com/watch?v=1d8gY9qf2jQ
  42. Обзор методов статистического анализа временных рядов и проблемы, возникающие при анализе нестационарных временных рядов. URL: https://cyberleninka.ru/article/n/obzor-metodov-statisticheskogo-analiza-vremennyh-ryadov-i-problemy-voznikayuschie-pri-analize-nestatsionarnyh-vremennyh-ryadov/viewer
  43. Прогнозирование с помощью модели ARIMA в системе Statistica. URL: https://www.rae.ru/forum2012/288/1507
  44. Box–Jenkins method. URL: https://en.wikipedia.org/wiki/Box%E2%80%93Jenkins_method
  45. Применение динамической модели ARMA-GARCH для прогнозирования динамики курса акций. URL: https://www.elibrary.ru/item.asp?id=23086937
  46. Box-Jenkins Methodology for ARIMA Models. URL: https://www.geeksforgeeks.org/box-jenkins-methodology-for-arima-models/
  47. Левинсон-Дурбин. URL: https://www.ibm.com/docs/ru/spss-statistics/27.0.1?topic=series-levinson-durbin
  48. Построение моделей временных рядов ARIMA в программе STATISTICA. URL: https://dzen.ru/a/YN9lXp2d-ACeD-oU
  49. Анализ методов оценки временных рядов сервером мониторинга информационно-телекоммуникационной сети общего пользования. URL: https://cyberleninka.ru/article/n/analiz-metodov-otsenki-vremennyh-ryadov-serverom-monitoringa-informatsionno-telekommunikatsionnoy-seti-obschego-polzovaniya/viewer
  50. Применение алгоритма Левинсона при реализации метода прямой оценки Д. URL: https://www.elibrary.ru/item.asp?id=12953267
  51. Временные ряды. Часть 3. URL: https://www.youtube.com/watch?v=1d8gY9qf2jQ
  52. Методика построения модели ARIMA для прогнозирования динамики временных рядов. URL: https://cyberleninka.ru/article/n/metodika-postroeniya-modeli-arima-dlya-prognozirovaniya-dinamiki-vremennyh-ryadov/viewer
  53. Прогнозирование временных рядов в пакете Statistica. URL: https://cyberleninka.ru/article/n/prognozirovanie-vremennyh-ryadov-v-pakete-statistica/viewer
  54. Глава 6 Установки форматов объектов системы MathCAD. URL: https://www.mathprofi.ru/mathcad-formats.html
  55. Методы прогнозирования временных рядов в маркетинговых исследованиях. URL: https://www.elibrary.ru/item.asp?id=20817088
  56. Статистическая обработка данных в системе MathCAD. URL: https://studfile.net/preview/4172551/
  57. Сведения о форматах файлов. URL: https://www.ptc.com/ru/support/mathcad/mathcad-prime/help/formats
  58. Прикладной статистический анализ данных. 10. Анализ временных рядов, ч. URL: https://www.machinelearning.ru/wiki/index.php?title=Прикладной_статистический_анализ_данных._10._Анализ_временных_рядов,_ч.
  59. Обработка данных средствами MathCAD. URL: https://www.bntu.by/uc/elib/metodichki/obrabotka-dannyh-sredstvami-mathcad.pdf
  60. Это просто! Часть 30. MathCAD и математическая статистика. Введение. Импорт данных для статистической обработки. URL: https://nestor.minsk.by/sr/2012/11/sr21102.html
  61. Временные ряды 5.11 Сравниваем AR, MA, и ARMA с автоподбором по AIC. URL: https://www.youtube.com/watch?v=1d8gY9qf2jQ
  62. Математическое и имитационное моделирование в MathCAD. URL: https://portal.tpu.ru/SHARED/k/KONSTANT/student/tab2/Mathcad_model.pdf
  63. Прогнозирование многомерных временных рядов: ARMAX vs VARMA. URL: https://www.reddit.com/r/statistics/comments/16g8v9c/d_forecasting_multivariate_time_series_armax_vs/
  64. Прикладной статистический анализ данных. 9. Анализ временных рядов, ча. URL: https://www.machinelearning.ru/wiki/index.php?title=Прикладной_статистический_анализ_данных._9._Анализ_временных_рядов,_ча.

Похожие записи