Гетероскедастичность в эконометрических моделях: от теории до практического устранения

В мире эконометрики, где каждая цифра стремится рассказать свою историю, а каждый коэффициент — раскрыть скрытую связь, важность точности и надежности оценок невозможно переоценить. Однако зачастую, стремясь к идеальной картине, исследователи сталкиваются с невидимыми «искажениями», способными свести на нет все усилия. Одно из таких искажений — гетероскедастичность. Она не просто техническая проблема, а своего рода «шум», который искажает сигналы, делает выводы ненадежными и может привести к ошибочным экономическим решениям, от неверного прогнозирования рисков до некорректной оценки эффективности государственной политики. Иными словами, игнорирование гетероскедастичности превращает потенциально ценные инсайты в статистический обман.

В этом исследовании мы погрузимся в мир гетероскедастичности, чтобы не только понять её природу, но и вооружиться арсеналом инструментов для её обнаружения и устранения. Наша цель — представить не просто сухую теорию, а структурированное, глубокое и максимально развернутое руководство, которое станет надежным фундаментом для студентов и аспирантов, выполняющих курсовые и дипломные работы по эконометрике. Мы пройдем путь от фундаментальных предпосылок метода наименьших квадратов до нюансов практического применения тестов Голдфельда-Квандта и Уайта, а также методов коррекции, таких как взвешенный МНК и робастные стандартные ошибки. Готовьтесь к путешествию, где сложные математические концепции оживут в контексте реальных экономических данных.

Введение в регрессионный анализ и предпосылки МНК

Регрессионный анализ — это краеугольный камень современной эконометрики, позволяющий исследовать зависимости между переменными и строить прогнозные модели. Однако его эффективность напрямую зависит от соблюдения определенных условий. Проблема гетероскедастичности, то есть непостоянства разброса ошибок модели, является одним из наиболее распространенных вызовов для корректности статистических выводов. Если её игнорировать, то, несмотря на кажущуюся адекватность модели, полученные результаты могут быть ненадежными, а сделанные на их основе экономические заключения — ошибочными. Понимание природы гетероскедастичности, методов её обнаружения и устранения критически важно для любого исследователя, стремящегося к строгости и достоверности своих эконометрических изысканий, поскольку без этого невозможно гарантировать достоверность полученных выводов.

Метод наименьших квадратов (МНК) как фундамент регрессионного анализа

Метод наименьших квадратов, известный как МНК (Ordinary Least Squares, OLS), не просто один из методов оценки — это настоящий краеугольный камень в фундаменте регрессионного анализа, мощный математический инструмент, чья универсальность позволяет решать широкий круг задач в математической статистике, эконометрике и даже в области машинного обучения. Его основная идея интуитивно проста, но математически элегантна: найти такую линию или плоскость (в многомерном пространстве), которая наилучшим образом аппроксимирует имеющиеся данные, минимизируя сумму квадратов отклонений фактических значений зависимой переменной от значений, предсказанных моделью.

Математически эта задача для линейной регрессии формулируется как поиск таких параметров α и β, которые минимизируют сумму квадратов остатков (ошибок) εi:

Σni=1 (yᵢ - ŷᵢ)² → min

Где:

  • yi — наблюдаемое значение зависимой переменной для i-го наблюдения.
  • ŷi — предсказанное значение зависимой переменной, рассчитанное по модели.

Для парной линейной регрессии, где зависимая переменная Y объясняется одной независимой переменной X, модель имеет вид:

ŷᵢ = α + βxᵢ

А для множественной регрессии, где Y зависит от нескольких объясняющих переменных X1, X2, …, Xk, модель выглядит так:

ŷᵢ = β₀ + β₁X₁ᵢ + β₂X₂ᵢ + … + βₖXₖᵢ

В матричной форме множественная регрессия выражается еще компактнее, подчеркивая ее алгебраическую структуру:

y = Xβ + ε

Где:

  • y — вектор наблюдаемых значений зависимой переменной.
  • X — матрица объясняющих переменных (включая столбец из единиц для константы).
  • β — вектор оцениваемых коэффициентов.
  • ε — вектор случайных ошибок.

Цель МНК — найти вектор β̂, который минимизирует сумму квадратов элементов вектора остатков ε̂ = yXβ̂. Это достигается путем решения системы нормальных уравнений, результатом которой являются оценки, обладающие рядом замечательных свойств, при условии выполнения определенных предпосылок. Именно эти предпосылки, или условия Гаусса-Маркова, определяют «доброкачественность» МНК-оценок и являются предметом нашего следующего раздела.

Классические предпосылки метода наименьших квадратов и теорема Гаусса-Маркова

Метод наименьших квадратов, несмотря на свою математическую простоту, не является панацеей, способной предоставить надежные оценки в любых условиях. Его эффективность и статистическая корректность напрямую зависят от выполнения ряда фундаментальных условий, известных как классические предпосылки МНК или условия Гаусса-Маркова. Эти предпосылки формируют каркас, на котором зиждется вся теория линейной регрессии.

Рассмотрим их более детально:

  1. Линейность по параметрам: Модель должна быть линейной по оцениваемым коэффициентам (β). Это не означает, что переменные X должны быть линейными; они могут быть квадратичными, логарифмическими или представлять собой произведения, но параметры должны входить в уравнение линейно. Например, Y = β0 + β1X + β2X2 + ε является линейной по параметрам βi, но нелинейной по переменной X.
  2. Нулевое математическое ожидание случайных ошибок: E(εi) = 0 для всех i. Это означает, что в среднем ошибки случайны и не имеют систематического смещения ни в одну, ни в другую сторону. Если это условие нарушается, модель будет систематически недооценивать или переоценивать зависимую переменную, что ведет к смещению оценок.
  3. Гомоскедастичность (постоянство дисперсии случайных ошибок): Var(εi|Xi) = σ2 для всех i. Дисперсия случайных ошибок должна быть постоянной для всех наблюдений и не зависеть от значений объясняющих переменных. Это критически важное условие, нарушение которого, известное как гетероскедастичность, является центральной темой нашего исследования.
  4. Отсутствие автокорреляции ошибок: Cov(εi, εj) = 0 для i ≠ j. Случайные ошибки разных наблюдений не должны быть коррелированы между собой. Это особенно важно в анализе временных рядов, где нарушение этого условия (автокорреляция) часто встречается и может указывать на пропущенные динамические эффекты.
  5. Отсутствие строгой мультиколлинеарности: Между объясняющими переменными не должно существовать точной линейной зависимости. То есть, ни одна объясняющая переменная не может быть выражена как точная линейная комбинация других объясняющих переменных. Строгая мультиколлинеарность делает матрицу XTX необратимой, что не позволяет получить уникальные МНК-оценки.
  6. Экзогенность объясняющих переменных: Cov(Xji, εi) = 0 для всех j и i. Объясняющие переменные должны быть некоррелированы со случайными ошибками. Это означает, что X не должна зависеть от ε и не должна быть «вызвана» Y. Нарушение этого условия (эндогенность) приводит к смещенным и несостоятельным оценкам МНК.
  7. Нормальное распределение ошибок (дополнительная предпосылка): εi ~ N(0, σ2). Хотя это условие не является строго необходимым для получения несмещенных и состоятельных оценок, оно критично для проведения статистических тестов значимости параметров (t- и F-статистик), так как именно на нем основаны их распределения. При больших выборках, благодаря центральной предельной теореме, нормальность ошибок менее важна, что облегчает работу исследователя.

При выполнении всех этих предпосылок вступает в силу знаменитая теорема Гаусса-Маркова, которая является одним из столпов эконометрики. Она утверждает, что МНК-оценки параметров регрессии являются **наилучшими линейными несмещенными оценками (BLUE – Best Linear Unbiased Estimators)**. Это не просто красивая формулировка, а гарантия высокого качества оценок, обладающих тремя ключевыми свойствами:

  • Несмещенность (Unbiasedness): E(β̂j) = βj. Означает, что математическое ожидание оценки равно истинному значению параметра. Другими словами, при многократном повторении процесса оценки, среднее значение полученных оценок будет стремиться к истинному значению параметра. Это отсутствие систематической ошибки.
  • Состоятельность (Consistency): plim(β̂j) = βj. При увеличении объема выборки (n → ∞) оценка β̂j сходится по вероятности к истинному значению параметра βj. Это свойство означает, что с ростом данных наши оценки становятся все более точными и надежными.
  • Эффективность (Efficiency): Var(β̂j) ≤ Var(β̃j). Среди всех линейных несмещенных оценок МНК-оценки обладают наименьшей дисперсией. Это означает, что они имеют наименьший разброс вокруг истинного значения параметра, являясь наиболее точными.

Таким образом, классические предпосылки МНК и теорема Гаусса-Маркова не просто набор правил, а фундаментальные принципы, соблюдение которых обеспечивает статистическую надежность и интерпретационную ценность эконометрических моделей. Нарушение любой из этих предпосылок требует особого внимания и применения адекватных корректирующих методов, как мы увидим на примере гетероскедастичности.

Гетероскедастичность: природа, идентификация и критические последствия

В эконометрическом моделировании мы часто стремимся уловить усредненные тенденции, однако реальность редко бывает однородной. Именно здесь кроется корень одной из наиболее коварных проблем — гетероскедастичности. Это не просто статистический термин, а отражение фундаментальной неоднородности экономических явлений, которая, если её игнорировать, может подорвать доверие к любым, даже самым изощренным, моделям. Гетероскедастичность — это голос изменчивости, который требует, чтобы к нему прислушались.

Определение и статистическая природа гетероскедастичности

Что же такое гетероскедастичность? Само слово, происходящее от греческих «гетеро» (разный) и «скедастос» (рассеяние), уже дает подсказку. В контексте регрессионного анализа гетероскедастичность означает непостоянство дисперсии случайных ошибок (или возмущений) εi регрессионной модели для различных наблюдений. Проще говоря, разброс остатков модели вокруг линии регрессии не одинаков по всей выборке.

В идеальном мире классической линейной регрессионной модели мы ожидаем гомоскедастичность, то есть постоянство дисперсий ошибок, что математически выражается условием:

Var(εᵢ|Xᵢ) = σ² для всех i

Здесь σ2 — это постоянная дисперсия, которая не зависит от значений объясняющих переменных Xi или номера наблюдения i. Все остатки имеют одинаковый, равномерный разброс.

Однако при наличии гетероскедастичности это условие нарушается, и дисперсия случайных ошибок становится переменной:

Var(εᵢ|Xᵢ) = σᵢ²

Где σi2 изменяется от наблюдения к наблюдению и часто зависит от значений одной или нескольких объясняющих переменных.

Экономическая природа гетероскедастичности неразрывно связана с анализом неоднородных объектов. Представьте, что мы исследуем зависимость потребительских расходов домохозяйств от их дохода. Естественно предположить, что у домохозяйств с низким доходом вариабельность расходов будет относительно небольшой, поскольку их бюджеты ограничены базовыми потребностями. В то же время, домохозяйства с высоким доходом имеют гораздо больше степеней свободы в своих расходах — они могут инвестировать, путешествовать, покупать предметы роскоши или экономить, что приводит к значительно большему разбросу их расходов относительно среднего значения. Таким образом, дисперсия ошибок (разброс фактических расходов вокруг предсказанных моделью) будет увеличиваться с ростом дохода.

Другой классический пример — изучение зависимости прибыли фирмы от размера её основного фонда. Небольшие фирмы, как правило, имеют более предсказуемую и менее волатильную прибыль. Крупные же корпорации, оперирующие на больших рынках, с более сложными бизнес-процессами и подверженные множеству внешних шоков, будут демонстрировать значительно большие колебания прибыли. Это опять же проявится в гетероскедастичности, где дисперсия остатков будет расти с увеличением размера фирмы. Это подтверждает, что гетероскедастичность часто является не просто статистическим дефектом, а ценным индикатором скрытых неоднородностей в данных.

Суть в том, что гетероскедастичность — это не просто статистическая аномалия, а часто содержательное отражение реальных экономических процессов, где степень неопределенности или вариабельности результатов зависит от масштаба или характеристик наблюдаемых объектов.

Визуальная диагностика гетероскедастичности

Прежде чем прибегать к сложным формальным тестам, опытный эконометрист всегда начинает с визуального анализа — первого и часто самого интуитивного шага в диагностике гетероскедастичности. Построение графиков остатков регрессии (ε̂i) против предсказанных значений зависимой переменной (ŷi) или против каждой из объясняющих переменных (Xji) может выявить характерные паттерны, сигнализирующие о нарушении предпосылки гомоскедастичности.

Какие паттерны следует искать?

  1. Веерообразная форма (расширяющийся или сужающийся веер): Это, пожалуй, самый классический признак гетероскедастичности. Если разброс остатков систематически увеличивается или уменьшается по мере роста значений предсказанной переменной или одной из объясняющих переменных, график будет напоминать распахнутый или закрывающийся веер.
    • Пример: На графике остатков против дохода (Xi) мы можем увидеть, как остатки концентрируются вокруг нуля при низких значениях дохода, а затем их разброс значительно увеличивается при высоких значениях дохода. Это напрямую иллюстрирует пример с домохозяйствами, рассмотренный выше.
  2. Конический вид: Похож на веерообразную форму, но может быть более выраженным. Остатки могут быть очень плотными в одной части графика и резко расходиться, образуя подобие конуса.
  3. Неоднородные полосы: Вместо равномерной полосы остатков вокруг нуля, мы видим, что ширина этой полосы меняется: где-то она узкая, где-то — широкая, без четкой линейной зависимости, но с очевидной неравномерностью.
  4. Волнообразные или другие систематические паттерны: Хотя реже, но иногда гетероскедастичность может проявляться и в более сложных систематических паттернах, где разброс остатков меняется немонотонно.

Как эти визуальные паттерны могут подсказать потенциальную переменную-источник гетероскедастичности?

Ключевая идея заключается в следующем: если веерообразная форма или другой систематический паттерн наблюдается на графике остатков против конкретной объясняющей переменной Xj, это является сильным индикатором того, что дисперсия ошибок Var(εi) скорее всего зависит от этой переменной Xj. Например, если мы строим графики остатков против «дохода», «размера фирмы» или «возраста респондента» и видим характерный веер, это не только подтверждает наличие гетероскедастичности, но и прямо указывает на потенциальный источник проблемы.

Таблица 1: Типичные паттерны на графиках остатков и их интерпретация

Паттерн на графике остатков (ε̂i) vs Xj или ŷi Интерпретация Потенциальная связь с гетероскедастичностью
Веерообразная форма (расширяющаяся) Дисперсия ошибок увеличивается с ростом Xj или ŷi. Часто встречается при анализе доходов/расходов (у богатых больше вариативность), размера компаний (крупные компании более волатильны).
Веерообразная форма (сужающаяся) Дисперсия ошибок уменьшается с ростом Xj или ŷi. Реже, но возможно, например, при изучении зависимости, где точность измерений улучшается с увеличением значения X.
Конические или нелинейные паттерны Дисперсия ошибок имеет сложную нелинейную зависимость от Xj или ŷi. Может указывать на пропущенные нелинейные эффекты, необходимость преобразования переменных.
Равномерная полоса вокруг нуля Отсутствие явных признаков гетероскедастичности (гомоскедастичность). Идеальный сценарий, когда дисперсия ошибок постоянна.

Визуальный анализ — это важный первый шаг. Он не заменяет формальные тесты, но помогает сформировать гипотезы и даже выбрать наиболее подходящий формальный тест. Если на графике остатков не наблюдается явных систематических паттернов, это хороший признак, но не абсолютная гарантия отсутствия гетероскедастичности, особенно при небольших в��борках.

Последствия гетероскедастичности для оценок МНК и статистических выводов

Гетероскедастичность — это не просто теоретическая прихоть эконометристов, а серьезная проблема, которая имеет глубокие и разрушительные последствия для результатов, полученных с помощью обычного метода наименьших квадратов (МНК). Понимание этих последствий критически важно, поскольку они напрямую влияют на надежность любых статистических выводов и, как следствие, на экономические решения. В конечном итоге, некорректные выводы могут привести к серьезным финансовым потерям или неэффективной политике.

Начнем с того, что, несмотря на всю свою вредоносность, гетероскедастичность не лишает МНК-оценки некоторых ценных свойств:

  • МНК-оценки коэффициентов остаются несмещенными и состоятельными. Это означает, что, как и при гомоскедастичности, в среднем оценки будут стремиться к истинным значениям параметров, и с увеличением объема выборки их точность будет повышаться. Таким образом, сама линия регрессии, хоть и не является оптимальной, все еще «попадает» в центр распределения данных.

Однако, на этом хорошие новости заканчиваются. Главное и наиболее пагубное последствие гетероскедастичности заключается в том, что:

  • МНК-оценки теряют свойство эффективности. Они больше не являются наилучшими линейными несмещенными оценками (BLUE), поскольку не обладают наименьшей дисперсией среди всех линейных несмещенных оценок. Это означает, что существуют другие методы оценки, которые могут дать более точные результаты, то есть оценки с меньшим разбросом вокруг истинного значения параметра.

Но это еще не все. Наиболее серьезные проблемы возникают при расчете стандартных ошибок коэффициентов:

  • Дисперсии оценок будут рассчитываться со смещением, что приводит к несостоятельности стандартных ошибок коэффициентов регрессии. Формулы для стандартных ошибок, используемые в обычном МНК, предполагают гомоскедастичность. При её нарушении эти формулы становятся некорректными, и полученные на их основе стандартные ошибки будут смещенными и несостоятельными. В большинстве случаев гетероскедастичность приводит к занижению стандартных ошибок.

Это напрямую ведет к катастрофическим последствиям для всех статистических выводов:

  • Из-за некорректно рассчитанных стандартных ошибок все статистические выводы, основанные на t- и F-статистиках (критериях Стьюдента и Фишера), а также интервальные оценки, становятся ненадежными и могут приводить к ошибочным заключениям о значимости коэффициентов и модели в целом.
    • t-статистика, используемая для проверки статистической значимости отдельных коэффициентов, рассчитывается как отношение оценки коэффициента к его стандартной ошибке: t = β̂j / SE(β̂j). Если стандартные ошибки занижены, t-статистики искусственно завышаются. Это увеличивает вероятность ошибки первого рода (Type I error), когда мы ошибочно отвергаем нулевую гипотезу о незначимости коэффициента и признаем его статистически значимым, хотя на самом деле он таковым не является.
    • Аналогично, F-статистика, используемая для проверки значимости модели в целом, также становится ненадежной.
    • Доверительные интервалы для коэффициентов, которые строятся на основе стандартных ошибок, будут слишком узкими, создавая ложное впечатление о высокой точности оценок.

Экономические последствия ошибочных выводов:

Именно здесь проблема гетероскедастичности выходит за рамки чистой статистики и приобретает критическое значение для прикладных экономических исследований и принятия решений:

  • Неверные рекомендации для политики: Если мы ошибочно признаем влияние какого-либо фактора статистически значимым (из-за заниженных стандартных ошибок), правительства или компании могут принять неверные политические решения, основанные на ложных причинно-следственных связях. Например, инвестировать в программу, которая на самом деле не оказывает заявленного эффекта.
  • Неправильная оценка рисков: В финансовой эконометрике, где дисперсия (волатильность) играет ключевую роль в оценке рисков, гетероскедастичность является нормой. Игнорирование её приведет к некорректной оценке рисков активов, что может повлечь за собой финансовые потери.
  • Некорректное прогнозирование: Если дисперсия ошибок непостоянна, то точность прогнозов, сделанных на основе такой модели, будет варьироваться для разных значений объясняющих переменных. Интервалы прогнозов будут некорректными, что снижает их практическую ценность.
  • Искажение понимания экономической реальности: Ошибочные выводы о значимости или не значимости факторов искажают наше понимание того, как устроены экономические процессы, и какие факторы действительно оказывают влияние на зависимую переменную.

Таким образом, гетероскедастичность, хоть и не смещает сами МНК-оценки, но делает все статистические выводы о них ненадежными. Это означает, что модель может быть в целом корректно специфицирована, но её статистическая интерпретация будет ошибочной. Поэтому крайне важно уметь обнаруживать гетероскедастичность и применять адекватные методы для коррекции этой проблемы.

Формальные тесты на гетероскедастичность: Голдфельда-Квандта и Уайта

Визуальный анализ, как бы он ни был полезен для первичной диагностики, не дает статистически обоснованных доказательств наличия гетероскедастичности. Для этого существуют специальные формальные тесты, которые позволяют проверить гипотезу о гомоскедастичности. Среди них два наиболее распространенных и важных — это тест Голдфельда-Квандта и тест Уайта. Каждый из них имеет свою логику, свои достоинства и ограничения, что определяет их области применения.

Тест Голдфельда-Квандта: алгоритм, достоинства и ограничения

Тест Голдфельда-Квандта (Goldfeld-Quandt test) — это мощный инструмент для обнаружения гетероскедастичности, особенно полезный, когда у исследователя есть априорные основания полагать, что дисперсия ошибок изменяется в зависимости от значений какой-либо конкретной объясняющей переменной. Он был предложен в 1965 году и до сих пор широко применяется благодаря своей относительной простоте и наглядности.

Предпосылки теста:

  • Нормальность распределения случайных ошибок.
  • Отсутствие автокорреляции ошибок.
  • Наличие предположения о переменной, от которой зависит дисперсия ошибок.

Формулировка гипотез:

  • Нулевая гипотеза (H0): Гомоскедастичность, то есть дисперсия случайных ошибок постоянна (Var(εi|Xi) = σ2).
  • Альтернативная гипотеза (H1): Гетероскедастичность, дисперсия случайных ошибок не постоянна и изменяется с изменением значений выбранной упорядочивающей переменной (например, Var(εi|Xi) = σi2).

Алгоритм проведения теста Голдфельда-Квандта:

  1. Упорядочивание наблюдений: Все n наблюдений в выборке упорядочиваются по возрастанию или убыванию значений независимой переменной, которая, предположительно, является источником гетероскедастичности. Например, если мы подозреваем, что дисперсия ошибок растет с доходом, мы сортируем все наблюдения по возрастанию дохода.
  2. Разбиение выборки: Упорядоченная выборка разбивается на три части:
    • Первая группа (k наблюдений): Состоит из наблюдений с наименьшими значениями упорядочивающей переменной.
    • Средняя группа (n — 2k наблюдений): Эта часть выборки исключается из рассмотрения. Её размер обычно составляет около 1/4 от общего числа наблюдений. Исключение средней части увеличивает мощность теста, делая различия в дисперсиях более явными. Например, Голдфелд и Квандт предлагали исключать 8 наблюдений при n = 30 (k = 11) и 16 наблюдений при n = 60 (k = 22).
    • Третья группа (k наблюдений): Состоит из наблюдений с наибольшими значениями упорядочивающей переменной. Количество наблюдений в первой и третьей группах (k) должно быть одинаковым.
  3. Оценка двух регрессий: Для первой и третьей подвыборок оцениваются две независимые регрессионные модели с использованием обычного МНК. Важно, чтобы количество наблюдений k в каждой подвыборке было достаточно большим для корректной оценки, то есть k > m + 1, где m — число объясняющих переменных в уравнении регрессии (без константы).
  4. Расчет сумм квадратов остатков (RSS): Для каждой из двух построенных моделей рассчитываются суммы квадратов остатков: RSS₁ для первой подвыборки и RSS₂ для третьей.
  5. Вычисление F-статистики: F-статистика вычисляется как отношение большей суммы квадратов остатков к меньшей. Если мы предполагаем, что дисперсия растет с увеличением упорядочивающей переменной, то ожидается, что RSS₂ будет больше RSS₁. В этом случае F = RSS₂ / RSS₁. Если предполагается, что дисперсия падает, то F = RSS₁ / RSS₂.
  6. Сравнение с критическим значением: Наблюдаемое значение F-статистики сравнивается с критическим значением F-распределения при выбранном уровне значимости α и степенях свободы ν1 = ν2 = k — (m + 1).
  7. Принятие решения: Если Fнабл > Fкрит, нулевая гипотеза о гомоскедастичности отвергается. Это означает, что есть статистические доказательства наличия гетероскедастичности.

Достоинства теста Голдфельда-Квандта:

  • Относительная простота и наглядность: Логика теста достаточно интуитивна, что делает его удобным для понимания и применения.
  • Применимость для небольших выборок: В отличие от некоторых асимптотических тестов, Голдфельда-Квандта может быть использован для выборок умеренного размера, при условии, что k достаточно велико для оценки регрессии.

Ограничения теста Голдфельда-Квандта:

  • Необходимость априорного предположения о переменной-источнике: Это главное ограничение. Тест требует, чтобы исследователь заранее знал или обоснованно подозревал, какая именно объясняющая переменная является источником гетероскедастичности, чтобы по ней упорядочить наблюдения. Если такая переменная выбрана неверно, тест может не обнаружить гетероскедастичность, даже если она присутствует.
  • Потеря мощности из-за исключения наблюдений: Исключение центральной части выборки, хотя и увеличивает контраст между дисперсиями и повышает эффективность теста (если гетероскедастичность действительно есть), означает, что часть информации из данных теряется. Это может снизить мощность теста (его способность отвергнуть ложную нулевую гипотезу), если гетероскедастичность проявляется менее выраженно или распределена немонотонно.
  • Не даёт информации о функциональной форме: Тест Голдфельда-Квандта лишь констатирует факт наличия гетероскедастичности. Он не предоставляет информации о конкретной функциональной форме зависимости дисперсии ошибок от регрессоров, что могло бы быть полезным при выборе метода коррекции (например, для Взвешенного МНК).
  • Неэффективен при сложной структуре гетероскедастичности: Если дисперсия ошибок зависит от нескольких переменных или имеет нелинейную, сложную форму, тест может быть нечувствительным.

Пример проведения теста Голдфельда-Квандта (концептуально в EViews):

Предположим, у нас есть модель: Y = C + βX1 + βX2 + ε. Мы подозреваем, что гетероскедастичность зависит от X1.

  1. В EViews загружаем данные.
  2. Сортируем данные по возрастанию X1.
  3. Определяем размер k (например, для n=50, k=20, исключаем 10 центральных наблюдений).
  4. Создаем две подвыборки: sample1 (наблюдения 1-20) и sample3 (наблюдения 31-50).
  5. Оцениваем регрессию Y = C + X1 + X2 для sample1 и получаем RSS₁.
  6. Оцениваем регрессию Y = C + X1 + X2 для sample3 и получаем RSS₂.
  7. Рассчитываем F = RSS₂ / RSS₁.
  8. Сравниваем полученное F-значение с критическим F-распределения с степенями свободы ν₁ = ν₂ = k - (m+1) = 20 — (2+1) = 17 при выбранном α.

Если, например, Fнабл = 3.5, а Fкрит(17, 17, 0.05) = 2.27, то мы отвергаем H0 и делаем вывод о наличии гетероскедастичности.

Тест Уайта: универсальный подход к обнаружению гетероскедастичности

В отличие от теста Голдфельда-Квандта, который требует априорных знаний о переменной-источнике гетероскедастичности, тест Уайта (White test), предложенный Хэлбертом Уайтом в 1980 году, является гораздо более универсальным. Он позволяет обнаружить гетероскедастичность, не делая жестких предположений о её конкретной функциональной форме, что делает его одним из самых популярных и широко используемых тестов. В чем же его универсальность, и как это помогает в практических исследованиях?

Отличительные черты теста Уайта:

  • Универсальность: Не требует априорной спецификации формы гетероскедастичности.
  • Асимптотический характер: Его надежность возрастает с увеличением размера выборки. Это означает, что для малых выборок результаты теста могут быть менее надежными.

Формулировка гипотез:

  • Нулевая гипотеза (H0): Гомоскедастичность, то есть условная дисперсия ошибок постоянна и не зависит от объясняющих переменных: Var(ε|X1, …, Xk) = σ2.
  • Альтернативная гипотеза (H1): Гетероскедастичность, при которой дисперсия ошибок зависит от объясняющих переменных: Var(ε|X1, …, Xk) = σ2(X1, …, Xk). Эта зависимость может быть сложной, включающей квадраты и произведения регрессоров.

Алгоритм проведения теста Уайта:

  1. Оценка исходной регрессии: Сначала исходная регрессионная модель оценивается с использованием обычного МНК по всем n наблюдениям:
    yᵢ = β₀ + β₁X₁ᵢ + ... + βₖXₖᵢ + εᵢ
  2. Вычисление квадратов остатков: Из этой исходной регрессии вычисляются остатки eᵢ, а затем их квадраты eᵢ².
  3. Построение вспомогательной регрессии: Строится вспомогательная регрессия, в которой квадраты остатков eᵢ² регрессируются на все объясняющие переменные исходной модели (включая константу), их квадраты и все возможные попарные произведения этих переменных.
    • Общий вид вспомогательного уравнения:
      eᵢ² = α₀ + α₁X₁ᵢ + ... + αₖXₖᵢ + γ₁X₁ᵢ² + ... + γₖXₖᵢ² + δ₁₂X₁ᵢX₂ᵢ + ... + νᵢ
    • Здесь νi — случайный член вспомогательной регрессии. Важно отметить, что при большом количестве объясняющих переменных (k) число переменных во вспомогательной регрессии может стать очень большим, что может привести к потере степеней свободы и даже к мультиколлинеарности. В таких случаях часто используется упрощенная версия теста, исключающая попарные произведения.
  4. Определение коэффициента множественной детерминации (R2): Для этой вспомогательной регрессии определяется коэффициент множественной детерминации R2, который показывает, какая доля вариации квадратов остатков объясняется регрессорами.
  5. Вычисление тестовой статистики: Вычисляется тестовая статистика Уайта по формуле:
    n·R²

    Где n — объем выборки.

  6. Сравнение с критическим значением χ2-распределения: Тестовая статистика nR2 имеет асимптотическое распределение хи-квадрат (χ2) с числом степеней свободы (df), равным количеству объясняющих переменных во вспомогательной регрессии (не считая константы).
    • Если исходная модель имеет k объясняющих переменных (без константы), то число переменных во вспомогательной регрессии (включая константу, линейные члены, квадраты и попарные произведения) равно 1 + k + k + k(k-1)/2. Соответственно, число степеней свободы для χ2-распределения равно k + k + k(k-1)/2 = (k² + 3k) / 2.
    • Если используются только линейные члены и их квадраты, то число степеней свободы будет 2k.
  7. Принятие решения: Полученное значение тестовой статистики сравнивается с критическим значением χ2-распределения при выбранном уровне значимости. Если наблюдаемое значение nR2 превышает критическое, нулевая гипотеза о гомоскедастичности отвергается в пользу альтернативной гипотезы о наличии гетероскедастичности.

Когда тест Уайта является предпочтительным:

  • Отсутствие априорных предположений: Когда нет четких гипотез о конкретной форме гетероскедастичности или о переменной, от которой она зависит. Тест Уайта «самодостаточен» в этом отношении.
  • Большие выборки: Из-за асимптотического характера теста, он наиболее надежен и предпочтителен при достаточно большом объеме выборки.

Достоинства и ограничения теста Уайта:

  • Главное достоинство — универсальность: Тест не требует спецификации конкретной формы гетероскедастичности, что делает его очень гибким и применимым в широком круге задач. Он может обнаружить различные виды гетероскедастичности.
  • Ограничения:
    • Потребление степеней свободы: При большом числе регрессоров (k) включение их квадратов и всех попарных произведений во вспомогательную регрессию может значительно увеличить количество объясняющих переменных. Это может привести к потере большого числа степеней свободы, а в некоторых случаях даже к мультиколлинеарности во вспомогательной регрессии, что делает её оценки нестабильными. Поэтому часто используется упрощенная версия теста.
    • Не указывает на функциональную форму: Тест Уайта позволяет выявить наличие гетероскедастичности, но, как и Голдфельд��-Квандта, не даёт прямого указания на её функциональную форму. Это усложняет выбор наиболее эффективного метода коррекции, если исследователь захочет применить Взвешенный МНК.
    • Чувствительность к неверной спецификации: Если исходная модель неправильно специфицирована (например, пропущены важные переменные или неверно выбрана функциональная форма), тест Уайта может ошибочно указать на гетероскедастичность, когда на самом деле проблема заключается в некорректной спецификации модели.

Пример проведения теста Уайта (концептуально в R):

В R тест Уайта часто реализован в пакетах, например, lmtest или car.

  1. Оцениваем исходную модель: model_orig <- lm(Y ~ X1 + X2, data = my_data)
  2. Применяем функцию теста Уайта: white_test <- bptest(model_orig, ~ poly(X1, X2, degree = 2, raw = TRUE), data = my_data) (здесь poly используется для включения квадратов и произведений).
  3. Результат вывода будет содержать Chi-squared статистику и p-value.

Интерпретация вывода в программе (например, EViews):

White Heteroskedasticity Test:

F-statistic               2.876543   Prob. F(5,44)          0.0245
Obs*R-squared             13.65432   Prob. Chi-Square(5)    0.0178

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 11/07/25   Time: 10:30
Sample: 1 50
Included observations: 50

Variable          Coefficient   Std. Error   t-Statistic   Prob.
------------------------------------------------------------------
C                 0.543210      0.123456     4.4000        0.0001
X1                0.012345      0.005678     2.1740        0.0349
X2                0.023456      0.009876     2.3750        0.0216
X1^2              0.000123      0.000056     2.1960        0.0331
X2^2              0.000056      0.000023     2.4340        0.0191
X1*X2             -0.000003     0.000001     -3.0000       0.0045
------------------------------------------------------------------
R-squared         0.273086   Mean dependent var  1.234567
Adjusted R-squared 0.198765   S.D. dependent var  0.876543
S.E. of regression 0.789012   Akaike info criterion  2.456789
Sum squared resid  27.30864   Schwarz criterion   2.678901
Log likelihood    -55.67890   Hannan-Quinn criter. 2.543210
Durbin-Watson stat 1.987654
------------------------------------------------------------------

Интерпретация:

  • Obs*R-squared (nR2) = 13.65432. Это значение сравнивается с критическим значением χ2.
  • Prob. Chi-Square(5) = 0.0178. df = 5, так как во вспомогательную регрессию включены константа, X1, X2, X12, X22, X1*X2 (всего 6 регрессоров, 6-1 = 5 степеней свободы).
  • Поскольку p-value (0.0178) меньше общепринятого уровня значимости α = 0.05, мы отвергаем нулевую гипотезу о гомоскедастичности. Есть статистические доказательства наличия гетероскедастичности. F-статистика даёт аналогичный результат.

Сравнительный анализ тестов Голдфельда-Квандта и Уайта

Выбор между тестами Голдфельда-Квандта и Уайта часто зависит от имеющейся информации и характеристик выборки. Оба теста служат для одной цели — обнаружения гетероскедастичности, но подходят к ней с разных сторон.

Таблица 2: Сравнительный анализ тестов Голдфельда-Квандта и Уайта

Характеристика Тест Голдфельда-Квандта Тест Уайта
Предпосылки Нормальность ошибок, отсутствие автокорреляции, априорное знание переменной-источника. Асимптотический тест, не требует нормальности (для больших выборок), отсутствие автокорреляции. Не требует априорного знания формы гетероскедастичности.
Логика Сравнение дисперсий ошибок в двух подвыборках (начало и конец, отсортированных по предполагаемой переменной). Регрессия квадратов остатков на исходные регрессоры, их квадраты и попарные произведения.
Тестовая статистика F-статистика (распределение Фишера). n·R² (асимптотически χ2-распределение).
Степени свободы ν1 = ν2 = k — (m+1) Количество регрессоров во вспомогательной регрессии (без константы).
Применимость Малые и средние выборки, когда есть четкие гипотезы о переменной-источнике. Большие выборки, когда нет априорных знаний о форме гетероскедастичности.
Достоинства Прост, нагляден, эффективен при правильном выборе переменной-источника. Универсален, обнаруживает различные формы гетероскедастичности, робастен к ненормальности ошибок при большой выборке.
Ограничения Необходимость выбора переменной-источника, потеря мощности из-за исключения наблюдений, не даёт инфо о форме гетероскедастичности. Может потреблять много степеней свободы, чувствителен к неверной спецификации модели, не указывает на функциональную форму гетероскедастичности.

Рекомендации по выбору теста:

  • Если есть чёткие теоретические или эмпирические основания полагать, что гетероскедастичность связана с конкретной объясняющей переменной (например, размер фирмы, доход, возраст), и выборка не очень большая, то тест Голдфельда-Квандта будет хорошим выбором. Он будет более мощным в обнаружении такого специфического вида гетероскедастичности.
  • Если форма гетероскедастичности неизвестна, или подозревается сложная зависимость от нескольких регрессоров, а также если объём выборки достаточно большой, то тест Уайта является предпочтительным. Его универсальность позволяет обнаружить широкий спектр паттернов гетероскедастичности.
  • При очень большом числе объясняющих переменных во избежание проблем с потерей степеней свободы и мультиколлинеарностью, часто используется упрощённая версия теста Уайта, где во вспомогательную регрессию включаются только линейные члены и их квадраты, без попарных произведений.

В практических исследованиях часто рекомендуется использовать оба теста или, по крайней мере, тест Уайта в сочетании с графическим анализом. Если оба теста указывают на гетероскедастичность, это значительно усиливает уверенность в наличии проблемы.

Методы устранения и смягчения проблемы гетероскедастичности

После того как гетероскедастичность была обнаружена, следующим шагом является её устранение или смягчение. Игнорирование этой проблемы, как мы уже убедились, приводит к некорректным статистическим выводам. К счастью, эконометрика предлагает несколько эффективных подходов, которые позволяют восстановить надежность оценок и обеспечить корректность статистических тестов. Выбор конкретного метода зависит от характера гетероскедастичности и целей исследования.

Взвешенный метод наименьших квадратов (ВМНК)

Взвешенный метод наименьших квадратов (Weighted Least Squares, WLS), часто называемый также Обобщённым МНК (ОМНК или Generalized Least Squares, GLS), является одним из наиболее мощных и теоретически обоснованных способов борьбы с гетероскедастичностью. Его логика элегантна: если дисперсия ошибок непостоянна, то наблюдения, связанные с более высокой дисперсией, несут в себе больше «шума» и, следовательно, меньше информации об истинной зависимости. ВМНК корректирует этот недостаток, присваивая этим «шумным» наблюдениям меньшие веса, а наблюдениям с меньшей дисперсией (более точным) — большие веса. Результатом является восстановление эффективности оценок, что позволяет получить наиболее точные коэффициенты.

Логика ВМНК:

Суть ВМНК состоит в преобразовании исходной модели таким образом, чтобы в преобразованной форме ошибки стали гомоскедастичными. После такого преобразования к преобразованной модели можно применять обычный МНК, и полученные оценки будут эффективными.

Математически, если дисперсия случайной ошибки Var(εi) = σi2, то мы можем преобразовать модель, разделив каждое наблюдение на σi (или на величину, которая пропорциональна σi).

Исходная модель:

yᵢ = β₀ + β₁X₁ᵢ + ... + βₖXₖᵢ + εᵢ

Разделим все члены на σi:

yᵢ/σᵢ = β₀/σᵢ + β₁X₁ᵢ/σᵢ + ... + βₖXₖᵢ/σᵢ + εᵢ/σᵢ

Обозначим преобразованные переменные:

yᵢ* = yᵢ/σᵢ
X₀ᵢ* = 1/σᵢ (для константы)
Xⱼᵢ* = Xⱼᵢ/σᵢ
εᵢ* = εᵢ/σᵢ

Тогда преобразованная модель будет выглядеть так:

yᵢ* = β₀X₀ᵢ* + β₁X₁ᵢ* + ... + βₖXₖᵢ* + εᵢ*

Теперь дисперсия преобразованной ошибки εi* равна:

Var(εᵢ*) = Var(εᵢ/σᵢ) = (1/σᵢ²)Var(εᵢ) = (1/σᵢ²)σᵢ² = 1

Таким образом, в преобразованной модели ошибки εi* имеют постоянную дисперсию, равную 1 (то есть гомоскедастичны). К этой преобразованной модели можно применять обычный МНК для получения эффективных оценок параметров β.

ВМНК минимизирует взвешенную сумму квадратов остатков:

Σni=1 wᵢ (yᵢ - ŷᵢ)² → min

Где wᵢ — весовой коэффициент для i-го наблюдения, который часто выбирается как wᵢ = 1/σᵢ².

Процедура ВМНК и условия эффективности:

Для того чтобы ВМНК дал эффективные оценки, необходимо знать или корректно оценить функциональную форму дисперсии ошибок σi2.

Практические подходы к оценке функциональной формы дисперсии ошибок, если она неизвестна (слепая зона):

Чаще всего истинные σi2 неизвестны, и их приходится оценивать. Это можно сделать в два этапа:

  1. Первичная оценка МНК: Оценить исходную модель обычным МНК и получить остатки eᵢ.
  2. Вспомогательная регрессия для дисперсии: Построить вспомогательную регрессию, в которой квадраты остатков eᵢ² регрессируются на одну или несколько объясняющих переменных, которые, по предположению, являются источником гетероскедастичности.
    • Например, если предполагается, что σi2 = γ0 + γ1X1i, то мы оцениваем: eᵢ² = γ₀ + γ₁X₁ᵢ + νᵢ.
    • Полученные предсказанные значения êᵢ² (которые представляют собой оценки σ̂i2) затем используются в качестве весов.
    • Другой распространённый случай: если дисперсия ошибки пропорциональна квадрату одной из независимых переменных, например, σi2 = σ02Xji2, то для преобразования модели все переменные делятся на Xji (а константа — на Xji).

Главный недостаток ВМНК:

  • Состоит в необходимости априорного знания или достаточно точной оценки функциональной формы дисперсий случайных ошибок. Если форма σi2 выбрана неверно, оценки ВМНК не будут эффективными, хотя и сохранят состоятельность и несмещённость.

Пример применения ВМНК (концептуально в Python с использованием statsmodels):

Предположим, мы выяснили, что σi2 ~ X1i2.

  1. Исходная модель: Y = β₀ + β₁X1 + β₂X2 + ε
  2. Создаём веса: weights = 1 / (X1**2)
  3. Оцениваем ВМНК: model_wls = sm.WLS(Y, sm.add_constant(X), weights=weights)
  4. Получаем результаты: results_wls = model_wls.fit()

Интерпретация результатов ВМНК аналогична обычному МНК, но теперь стандартные ошибки и t-статистики являются корректными и эффективными.

Использование робастных стандартных ошибок (стандартные ошибки Уайта)

В ситуациях, когда истинная форма гетероскедастичности неизвестна или слишком сложна для точной спецификации (что часто бывает на практике), ВМНК становится трудноприменимым. В этом случае на помощь приходят робастные стандартные ошибки (Heteroskedasticity-Consistent Standard Errors), разработанные Уайтом. Этот подход является более прагматичным: он не пытается устранить саму гетероскедастичность, а вместо этого корректирует оценки стандартных ошибок таким образом, чтобы они были состоятельными (то есть приближались к истинным значениям при увеличении выборки) даже при наличии гетероскедастичности. Это обеспечивает надёжность статистических выводов, несмотря на отсутствие эффективности оценок.

Концепция робастных стандартных ошибок:

  • МНК-оценки коэффициентов остаются несмещёнными и состоятельными. Как уже говорилось, гетероскедастичность не влияет на эти свойства самих оценок.
  • Стандартные ошибки корректируются: Робастные стандартные ошибки обеспечивают корректное тестирование гипотез и построение доверительных интервалов в условиях гетероскедастичности. Они «защищены» от искажающего влияния непостоянной дисперсии ошибок.

Логика заключается в том, что вместо использования одной общей оценки дисперсии ошибок (σ2) для всех наблюдений, робастные стандартные ошибки используют индивидуальные оценки дисперсии для каждого наблюдения (ei2) при расчёте ковариационной матрицы оценок коэффициентов.

Различные версии гетероскедастично-состоятельных (HC) стандартных ошибок (слепая зона):

В эконометрических пакетах часто предлагается несколько версий HC-стандартных ошибок, которые отличаются способами корректировки смещения в небольших выборках:

  • HC0 (White’s original): Оригинальная формула Уайта, которая является асимптотически состоятельной.
  • HC1: Включает поправку на количество степеней свободы, аналогичную той, что используется в стандартных формулах дисперсии остатков МНК: (n / (n — k — 1)) * HC0. Часто используется по умолчанию.
  • HC2: Более сложная поправка, которая также корректирует смещение и часто лучше работает в небольших выборках, особенно если модель имеет высокие левериджи (влиятельные наблюдения).
  • HC3: Рекомендуется для очень малых выборок, так как она ещё более агрессивно корректирует смещение.

Выбор между этими версиями обычно не критичен для больших выборок, но для малых выборок HC2 или HC3 могут быть предпочтительнее.

Преимущества робастных стандартных ошибок:

  • Универсальность: Не требуют знания конкретной функциональной формы гетероскедастичности.
  • Простота применения: В современных эконометрических пакетах (R, Python, EViews, Stata) их расчёт реализован как простая опция.
  • Корректность статистических выводов: Гарантируют состоятельность стандартных ошибок, t-статистик и доверительных интервалов, даже если модель не является эффективной.

Ограничения:

  • Не повышают эффективность оценок МНК: Сами оценки коэффициентов не становятся более эффективными; они остаются такими же, как и при обычном МНК, но их стандартные ошибки становятся надёжными.
  • Могут быть менее точными для малых выборок: Хотя существуют поправки, в очень малых выборках их надёжность может быть невысокой.

Пример применения робастных стандартных ошибок (концептуально в Stata):

После оценки обычной МНК-регрессии:

  1. regress Y X1 X2
  2. Для получения робастных стандартных ошибок достаточно добавить опцию robust:
    regress Y X1 X2, robust

Сравнение обычных и робастных стандартных ошибок (вывод Stata):

. regress Y X1 X2

      Source |       SS           df       MS      Number of obs =      50
-------------+----------------------------------   F(2, 47)      =   15.67
       Model |  150.000000         2  75.000000   Prob > F      =   0.0000
    Residual |  225.000000        47   4.787234   R-squared     =   0.4000
-------------+----------------------------------   Adj R-squared =   0.3745
       Total |  375.000000        49   7.653061   Root MSE      =    2.188
---------------------------------------------------------------------------
Y        | Coefficient  Std. Error   t     P>|t|       [95% Conf. Interval]
-------------+-------------------------------------------------------------
X1       |    0.750000    0.150000   5.00  0.000     0.448206    1.051794
X2       |    0.500000    0.100000   5.00  0.000     0.298804    0.701196
_cons    |    1.000000    0.500000   2.00  0.051     -0.000001   2.000001
---------------------------------------------------------------------------

. regress Y X1 X2, robust

Linear regression                               Number of obs =      50
                                                F(2, 47)      =    9.50
                                                Prob > F      =    0.0004
                                                R-squared     =    0.4000
                                                Root MSE      =   2.188
---------------------------------------------------------------------------
Y        | Coefficient  Std. Error   t     P>|t|       [95% Conf. Interval]
-------------+-------------------------------------------------------------
X1       |    0.750000    0.200000   3.75  0.000     0.347530    1.152470
X2       |    0.500000    0.180000   2.78  0.008     0.138804    0.861196
_cons    |    1.000000    0.650000   1.54  0.130     -0.306001   2.306001
---------------------------------------------------------------------------

Сравнение:

  • Коэффициенты регрессии (Coefficient) не изменились (0.75 для X1, 0.5 для X2).
  • Однако стандартные ошибки (Std. Error) увеличились (например, для X1 с 0.15 до 0.20; для X2 с 0.10 до 0.18).
  • Из-за увеличения стандартных ошибок t-статистики уменьшились (для X1 с 5.00 до 3.75; для X2 с 5.00 до 2.78).
  • Соответственно, p-значения (P>|t|) увеличились. Если раньше _cons был значим на 5% уровне (p=0.051), то с робастными ошибками он становится незначимым (p=0.130).

Это наглядно демонстрирует, как гетероскедастичность может приводить к ложным выводам о статистической значимости. Использование робастных ошибок позволяет избежать подобных ошибок и получить более достоверные результаты.

Преобразование переменных и ре-спецификация модели

Помимо ВМНК и робастных стандартных ошибок, существуют и другие, более фундаментальные подходы к борьбе с гетероскедастичностью, которые часто затрагивают саму структуру модели или характер данных. Эти методы включают преобразование переменных и ре-спецификацию модели. Их преимущество в том, что они могут устранить первопричину проблемы, а не только её последствия.

Преобразование переменных:

Идея преобразования переменных заключается в том, чтобы изменить шкалу измерения зависимой или объясняющих переменных таким образом, чтобы стабилизировать дисперсию ошибок и приблизить её к гомоскедастичности.

  • Логарифмические преобразования: Это одно из наиболее распространённых и эффективных преобразований. Часто используется логарифмирование зависимой переменной (ln Y) или как зависимой, так и объясняющих переменных (ln Y = β0 + β1 ln X1 + … + ε).
    • Почему это работает? Логарифмирование сжимает масштабы переменных, особенно при наличии больших значений, что часто приводит к стабилизации дисперсии. Логарифмы также часто помогают, если модель имеет мультипликативный характер (Y = X₁β₁ * X₂β₂ * eε), превращая её в линейную по логарифмам.
    • Пример: Если мы моделируем зависимость объёма продаж от рекламных расходов, и наблюдается, что разброс продаж увеличивается с ростом рекламных расходов, логарифмирование продаж может помочь.
  • Преобразования Бокса-Кокса (Box-Cox transformations): Это более общий класс преобразований, который включает логарифмирование и возведение в степень как частные случаи. Преобразование Бокса-Кокса позволяет эмпирически выбрать оптимальную степень для преобразования переменной, которая наилучшим образом обеспечивает нормальность и гомоскедастичность.
    • Y(λ) = (Yλ — 1) / λ (для λ ≠ 0)
    • Y(λ) = ln(Y) (для λ = 0)
    • Это преобразование особенно полезно, когда нет чётких априорных указаний на тип необходимого преобразования.

Ре-спецификация модели:

Иногда гетероскедастичность не является присущим свойством данных, а скорее симптомом неправильно специфицированной модели. В таких случаях изменение спецификации может полностью решить проблему.

  • Пропущенные переменные (Omitted Variable Bias): Если в модели отсутствуют важные объясняющие переменные, которые коррелированы с включёнными регрессорами и влияют на зависимую переменную, остатки модели могут «впитывать» их влияние, что приводит к появлению систематических паттернов, включая гетероскедастичность.
    • Пример: Изучая доходы, если мы не включим переменную «образование», то разброс доходов среди людей с одинаковым «опытом работы» может быть очень разным из-за неучтённого уровня образования, что проявится как гетероскедастичность. Добавление важных пропущенных переменных может устранить гетероскедастичность.
  • Неверная функциональная форма: Если истинная зависимость между переменными нелинейна, а мы специфицируем линейную модель, это также может привести к гетероскедастичности.
    • Пример: Если зависимость Y от X на самом деле квадратична (Y = β0 + β1X + β2X2 + ε), а мы моделируем её как линейную (Y = β0 + β1X + ε), то остатки будут демонстрировать систематический паттерн, включая потенциальную гетероскедастичность. Коррекция функциональной формы (например, добавление квадратичных членов, использование интеракций) может помочь.

Эти методы, в отличие от ВМНК и робастных ошибок, направлены на устранение первопричины проблемы, а не только на её последствия или корректировку. Они требуют более глубокого понимания экономической теории и характера данных.

Сравнительный анализ ВМНК и робастных стандартных ошибок

После того как мы рассмотрели каждый из основных методов борьбы с гетероскедастичностью по отдельности, важно провести их сравнительный анализ, чтобы понять, когда и какой подход является наиболее предпочтительным. Выбор между ВМНК и робастными стандартными ошибками представляет собой компромисс между эффективностью оценок и простотой применения/надёжностью в условиях неопределённости.

Таблица 3: Сравнительный анализ Взвешенного МНК (ВМНК) и Робастных стандартных ошибок (HCSE)

Характеристика Взвешенный метод наименьших квадратов (ВМНК) Робастные стандартные ошибки (HCSE)
Цель Получение эффективных оценок параметров (восстановление BLUE-свойств). Получение состоятельных стандартных ошибок для корректных стат. выводов.
Подход Преобразование модели для достижения гомоскедастичности ошибок, затем применение МНК. Корректировка формул стандартных ошибок без изменения самой модели или оценок.
Оценки коэффициентов Несмещённые, состоятельные, эффективные. Несмещённые, состоятельные, но не эффективные (такие же, как у обычного МНК).
Стандартные ошибки Корректные и эффективные. Корректные и состоятельные, но не обязательно эффективные.
Требования к знанию Необходимо знать или точно оценить функциональную форму дисперсии ошибокi2). Не требуется знания функциональной формы дисперсии ошибок.
Сложность применения Более сложен, требует шагов по оценке σi2 или преобразованию данных. Относительно прост, является опцией в большинстве эконометрических пакетов.
Применимость Идеален, когда форма гетероскедастичности известна или может быть надёжно оценена. Предпочтителен, когда форма гетероскедастичности неизвестна/сложна, или когда главное — это корректность статистических выводов.
Влияние на мощность тестов Повышает мощность тестов значимости за счёт эффективных оценок. Обеспечивает корректность уровня значимости тестов, но не повышает мощность оценок.
Риск неправильного применения Высокий риск неверных выводов, если форма σi2 специфицирована неверно. Низкий риск неправильного применения, так как не требует спецификации формы.

Когда следует предпочесть один другому?

  1. Если у вас есть сильные теоретические или эмпирические основания для конкретной функциональной формы гетероскедастичности (например, вы уверены, что дисперсия ошибок пропорциональна квадрату дохода), и вы можете надёжно оценить эту форму, то Взвешенный МНК является предпочтительным. Это позволит получить наиболее эффективные (наиболее точные) оценки коэффициентов, а следовательно, и наиболее мощные статистические тесты.
  2. Если форма гетероскедастичности неизвестна, сложна, или у вас нет уверенности в её правильной спецификации, а также если основная цель — получить корректные статистические выводы о значимости коэффициентов, то использование робастных стандартных ошибок является оптимальным решением. Этот подход является более «безопасным» и универсальным, поскольку не накладывает строгих требований на знание формы гетероскедастичности. Он гарантирует, что ваши t- и F-статистики будут корректны, даже если оценки коэффициентов не являются абсолютно эффективными.
  3. В практических исследованиях, особенно при достаточно больших выборках, применение робастных стандартных ошибок стало почти стандартом де-факто, поскольку оно является простым, надёжным и гарантирует корректность выводов, даже если другие методы коррекции не применяются.
  4. Комбинированный подход: Иногда можно использовать робастные стандартные ошибки в сочетании с преобразованием переменных или ре-спецификацией модели. Например, сначала попробовать логарифмирование, а затем, если гетероскедастичность всё ещё остаётся, применить робастные стандартные ошибки.

В конечном итоге, выбор метода зависит от глубины вашего понимания природы гетероскедастичности в конкретных данных и ваших целей. ВМНК — это «идеальное» решение для эффективности, но требует знаний. Робастные ошибки — это «практическое» решение для корректности выводов, не требующее столь глубоких знаний о форме гетероскедастичности.

Практические шаги по построению и анализу регрессионной модели с учётом гетероскедастичности

Построение и анализ регрессионной модели — это и наука, и искусство. Когда в игру вступает гетероскедастичность, процесс становится многоэтапным, требующим внимания к деталям и последовательности действий. Для студента или аспиранта, работающего над курсовой или дипломной работой, критически важно следовать чёткому алгоритму, чтобы получить надёжные и обоснованные результаты.

Этапы построения модели

  1. Спецификация модели:
    • Начинаем с тщательной проработки теоретических основ. Какие экономические переменные должны быть включены в модель? Какова ожидаемая функциональная форма (линейная, логарифмическая, квадратичная)?
    • Чётко определяем зависимую переменную (Y) и набор объясняющих переменных (X1, X2, …, Xk).
    • Формулируем экономические гипотезы о знаках и величине ожидаемых коэффициентов.
  2. Сбор данных и их предварительный анализ:
    • Собираем необходимые эмпирические данные, используя надёжные источники (Росстат, Всемирный банк, МВФ и т.д.).
    • Проводим первичный описательный анализ данных: расчёт средних, медиан, стандартных отклонений, минимальных и максимальных значений.
    • Строим гистограммы для оценки распределения переменных, диаграммы рассеяния для визуализации парных связей между переменными. Это помогает выявить выбросы, нелинейные зависимости и потенциальные проблемы с данными.

Оценка и диагностика

  1. Оценка модели методом МНК:
    • На этом этапе мы оцениваем модель, как если бы гетероскедастичности не было. Используем обычный метод наименьших квадратов (ОМНК) для получения первичных оценок коэффициентов (β̂j).
    • Фиксируем стандартные ошибки, t-статистики, p-значения и R2, чтобы в дальнейшем сравнить их с результатами после коррекции гетероскедастичности.
  2. Детальный графический анализ остатков:
    • Это первый и очень важный шаг в диагностике гетероскедастичности. Строим графики квадратов остатков (ei2) или абсолютных значений остатков (|ei|) против:
      • Предсказанных значений зависимой переменной (ŷi).
      • Каждой из объясняющих переменных (Xji).
    • Ищем характерные паттерны: веерообразную форму (расширяющийся или сужающийся веер), конический вид. Эти паттерны могут подсказать, какая переменная является источником гетероскедастичности, и даже намекнуть на её функциональную форму.
    • Пример: Если на графике ei2 против X1 наблюдается веерообразная форма, это указывает на зависимость дисперсии от X1.
  3. Проведение формальных тестов на гетероскедастичность:
    • Тест Голдфельда-Квандта: Применяем, если графический анализ или экономическая теория дают основания предполагать, что гетероскедастичность зависит от конкретной переменной.
      • Упорядочиваем данные по этой переменной, разбиваем на подвыборки, оцениваем две регрессии и рассчитываем F-статистику.
      • Сравниваем Fнабл с Fкрит и принимаем решение.
    • Тест Уайта: Является универсальным, используем его, когда нет априорных знаний о конкретной форме гетероскедастичности, или для подтверждения результатов графического анализа/теста Голдфельда-Квандта.
      • Строим вспомогательную регрессию квадратов остатков на исходные регрессоры, их квадраты и попарные произведения.
      • Рассчитываем статистику nR2 и сравниваем её с критическим значением χ2-распределения.
    • Интерпретация результатов: На основе p-значений или сравнения тестовых статистик с критическими значениями делаем вывод о наличии или отсутствии гетероскедастичности. Если нулевая гипотеза о гомоскедастичности отвергается, проблема существует.

Коррекция и ре-анализ

  1. Выбор адекватного метода устранения/смягчения гетероскедастичности:
    • Если форма гетероскедастичности известна или может быть надёжно оценена (например, по результатам графического анализа или вспомогательной регрессии), и вы хотите получить эффективные оценки, то применяем Взвешенный метод наименьших квадратов (ВМНК).
    • Если форма гетероскедастичности неизвестна, сложна, или вашей главной целью является получение корректных статистических выводов, а не повышение эффективности оценок, используем робастные стандартные ошибки Уайта. Это наиболее частый и прагматичный выбор.
    • Рассмотрим преобразование переменных (например, логарифмирование), если это соответствует экономической логике модели и может стабилизировать дисперсию.
    • Пере-спецификация модели: В случае подозрения на пропущенные переменные или неверную функциональную форму, вносим корректировки в модель (добавляем переменные, квадратичные члены и т.д.) и повторяем диагностику.
  2. Повторная оценка модели и анализ результатов:
    • После применения выбранного метода коррекции модель переоценивается (либо с использованием ВМНК, либо с пересчётом стандартных ошибок).
    • Анализ полученных параметров: Сравниваем оценки коэффициентов, стандартные ошибки, t-статистики и p-значения с теми, что были получены на этапе первичной оценки МНК. Обращаем внимание на изменения в статистической значимости коэффициентов.
    • Интерпретация результатов: Делаем выводы о влиянии объясняющих переменных на зависимую, основываясь на скорректированных (и теперь надёжных) статистических выводах.
    • Оцениваем общую адекватность модели (R2, F-статистика, знаки коэффициентов в соответствии с теорией).

Сквозной пример (кейс-стади) анализа экономических данных (концептуально):

Представим, что мы исследуем зависимость Расходов на образование (Y) от Дохода домохозяйства (X1) и Числа детей (X2) в выборке из 100 домохозяйств.

  1. Спецификация: Линейная модель Y = β₀ + β₁X1 + β₂X2 + ε. Ожидаем, что с ростом дохода и числа детей расходы на образование увеличиваются.
  2. Оценка МНК (в EViews): Получаем Y = 150 + 0.15*X1 + 50*X2. Для X1 p-value = 0.001, для X2 p-value = 0.005. Обе переменные кажутся значимыми.
  3. Графический анализ остатков: Строим график ei2 против X1. Обнаруживаем явный расширяющийся веер: при низких доходах разброс остатков мал, при высоких — велик. Это указывает на гетероскедастичность, связанную с доходом.
  4. Формальные тесты:
    • Тест Голдфельда-Квандта (упорядочиваем по X1): Получаем Fнабл = 3.8 (Fкрит = 2.0). Отвергаем H0.
    • Тест Уайта: Получаем Obs*R-squared = 18.5 (p-value = 0.008). Отвергаем H0.
    • Вывод: Оба теста подтверждают наличие гетероскедастичности.
  5. Выбор метода коррекции: Поскольку есть чёткое указание на X1 как источник, можно попробовать ВМНК, но более универсальным и быстрым решением будет использование робастных стандартных ошибок.
  6. Повторная оценка с робастными стандартными ошибками (в EViews): Переоцениваем модель, выбирая опцию «Robust Standard Errors».
    • Оценки коэффициентов остаются прежними: Y = 150 + 0.15*X1 + 50*X2.
    • Однако стандартные ошибки для X1 и X2 значительно увеличились.
    • Для X1 новое p-value = 0.08 (было 0.001). Теперь X1 статистически незначим на 5% уровне!
    • Для X2 новое p-value = 0.03 (было 0.005). X2 остаётся значимым, но менее уверенно.
  7. Итоговый вывод: Изначально казалось, что и доход, и число детей значимо влияют на расходы на образование. После коррекции на гетероскедастичность выяснилось, что доход домохозяйства, возможно, не оказывает статистически значимого влияния на расходы на образование на 5% уровне, в то время как число детей продолжает оказывать значимое влияние. Это кардинально меняет экономические выводы и рекомендации.

Такой пошаговый подход, включающий не только применение инструментов, но и вдумчивую интерпретацию результатов, является залогом успешного эконометрического исследования. Ведь в чём смысл построения модели, если её выводы вводят в заблуждение?

Выводы и рекомендации

Наше путешествие по миру гетероскедастичности показало, что эта проблема в эконометрических моделях — не просто академическое упражнение, а серьёзное препятствие на пути к получению надёжных и экономически обоснованных выводов. Мы увидели, как нарушение предпосылки гомоскедастичности, при всей своей незаметности для самих МНК-оценок, разрушает фундамент для корректных статистических тестов, делая t- и F-статистики ненадежными и вводя в заблуждение относительно значимости коэффициентов. Последствия этого могут быть весьма ощутимыми: от неверных прогнозов до ошибочных решений в экономической политике.

Ключевые выводы:

  • Гетероскедастичность — это реальное отражение неоднородности экономических процессов, где вариативность ошибок модели зависит от значений объясняющих переменных.
  • Игнорирование гетероскедастичности ведёт к неэффективности оценок МНК и, что критически важно, к несостоятельности их стандартных ошибок. Это искажает все последующие статистические выводы о значимости параметров и модели в целом.
  • Визуальный анализ остатков является ценным первым шагом, который может указать на наличие гетероскедастичности и её потенциальные источники.
  • Формальные тесты, такие как Голдфельда-Квандта и Уайта, необходимы для статистически обоснованного обнаружения проблемы. Тест Голдфельда-Квандта предпочтителен при наличии априорной информации о переменной-источнике, тогда как тест Уайта является более универсальным, особенно для больших выборок.
  • Существуют эффективные методы для устранения или смягчения гетероскедастичности:
    • Взвешенный метод наименьших квадратов (ВМНК) позволяет получить эффективные оценки, но требует точного знания или надёжной оценки функциональной формы дисперсии ошибок.
    • Робастные стандартные ошибки (стандартные ошибки Уайта) являются прагматичным и универсальным решением, обеспечивающим состоятельность статистических выводов без необходимости спецификации формы гетероскедастичности, хотя и не повышают эффективность самих оценок.
    • Преобразование переменных и ре-спецификация модели могут быть применены для устранения первопричины проблемы.

Практические рекомендации для дальнейших исследований:

  1. Комплексный подход: Всегда начинайте с теоретического обоснования и предварительного анализа данных. Используйте графический анализ остатков для формирования гипотез, а затем подтверждайте их формальными тестами.
  2. Не ограничивайтесь одним тестом: Применяйте несколько тестов на гетероскедастичность (например, Голдфельда-Квандта и Уайта), чтобы получить более надёжные доказательства.
  3. Осторожность в интерпретации: Помните, что гетероскедастичность может быть симптомом более глубоких проблем, таких как неверная спецификация модели или пропущенные переменные.
  4. Выбор метода коррекции:
    • Если вы уверены в форме гетероскедастичности, рассмотрите ВМНК.
    • В большинстве практических случаев, особенно при больших выборках, использование робастных стандартных ошибок является надёжным и рекомендованным методом для обеспечения корректности статистических выводов.
    • Исследуйте возможность преобразования переменных или пере-спецификации модели, если это имеет экономический смысл и может устранить проблему на более фундаментальном уровне.
  5. Всегда документируйте свои шаги: Подробно описывайте выбранные методы, их обоснование и интерпретацию результатов в вашей курсовой или дипломной работе.

Направления для дальнейшего изучения:

  • Другие методы обнаружения гетероскедастичности: Исследуйте тест Бройша-Пагана (Breusch-Pagan test), который также широко используется и является более мощным, чем Голдфельда-Квандта, в некоторых случаях.
  • Модели условной гетероскедастичности: В финансовой эконометрике динамическая природа волатильности ошибок требует изучения моделей ARCH (Autoregressive Conditional Heteroskedasticity) и GARCH (Generalized Autoregressive Conditional Heteroskedasticity), которые специально разработаны для моделирования изменяющейся во времени дисперсии.
  • Более продвинутые робастные методы: Ознакомьтесь с другими типами гетероскедастично-состоятельных стандартных ошибок (HC4, HC5) и условиями их применения.

Умение работать с гетероскедастичностью — это признак зрелого исследователя, способного критически оценивать результаты и получать по-настоящему надёжные эконометрические модели. Пусть это исследование станет вашим надёжным путеводителем в этом важном аспекте эконометрического анализа.

Список использованной литературы

  1. Орлов А.И. Эконометрика. Учебник. М.: Экзамен, 2002.
  2. Статистика: Учебник для ВУЗов / под ред. И.И. Елисеевой. М.: Проспект, 2006. 443 с.
  3. Эконометрика: Учебник для ВУЗов / под ред. И.И. Елисеевой. М.: Финансы и статистика, 2004. 344 с.
  4. Комиссарчик В.Ф. Эконометрика: Учебное пособие. Тверь: ТГТУ, 2003. 77 с.
  5. Математика для экономистов / под ред. Н.Ш. Кремера. М: Высшее образование, 2007. 645 с.
  6. Баклушина О.А. Краткий курс по эконометрике. М., 2007. 126 с.
  7. Практикум по эконометрике / под ред. И.И. Елисеевой. М.: Финансы и статистика, 2001.
  8. Гетероскедастичность и ее последствия. URL: https://univer-nn.ru/ekonometrika/geteroskedastichnost-i-ee-posledstviya/ (дата обращения: 07.11.2025).
  9. Тест Голдфелда-Квандта с примером. Справочник Автор24. URL: https://spravochnikov.ru/obuchenie/test-goldfelda-kvandta-s-primerom (дата обращения: 07.11.2025).
  10. Тест Уайта. Википедия. URL: https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D1%81%D1%82_%D0%A3%D0%B0%D0%B9%D1%82%D0%B0 (дата обращения: 07.11.2025).
  11. Тест Голдфелда — Квандта. Практическая эконометрика в кейсах. Studref.com. URL: https://studref.com/469604/ekonomika/test_goldfelda_kvandta (дата обращения: 07.11.2025).
  12. Метод наименьших квадратов. Википедия. URL: https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%BD%D0%B0%D0%B8%D0%BC%D0%B5%D0%BD%D1%8C%D1%88%D0%B8%D1%85_%D0%BA%D0%B2%D0%B0%D0%B4%D1%80%D0%B0%D1%82%D0%BE%D0%B2 (дата обращения: 07.11.2025).
  13. Национальный статистический комитет Республики Беларусь. URL: http://belstat.gov.by/homep/ru/indicators/main1.php (дата обращения: 07.11.2025).
  14. Издательский центр ИПМ (исследования, прогнозы, мониторинг). URL: http://research.by/rus/data/source/ (дата обращения: 07.11.2025).
  15. Гетероскедастичность моделей, ее обнаружение и методы устранения. Интуит. URL: https://www.intuit.ru/studies/courses/200/52/lecture/2096?page=1 (дата обращения: 07.11.2025).
  16. Гетероскедастичность в эконометрике. URL: https://univer-nn.ru/ekonometrika/geteroskedastichnost-v-ekonometrike/ (дата обращения: 07.11.2025).
  17. Основные предпосылки МНК. Теорема Гаусса — Маркова. Эконометрика. URL: https://bstudy.ru/lecture/predposylki-mnk-teorema-gaussa-markova.html (дата обращения: 07.11.2025).
  18. Тест Уайта на гетероскедастичность. Форсайт. URL: https://fars.ru/test-uayta-na-geteroskedastichnost (дата обращения: 07.11.2025).
  19. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ. Информационная система университета. URL: https://sdo.kantiana.ru/moodle/mod/resource/view.php?id=123000 (дата обращения: 07.11.2025).
  20. Метод наименьших квадратов – мощный инструмент, находящий широкое применение в самых разнообразных областях. Инфостарт. URL: https://infostart.ru/public/121898/ (дата обращения: 07.11.2025).
  21. Гетероскедастичность: определение и последствия. Учебник+. URL: https://uchebnikplus.ru/5-1-geteroskedastichnost-opredelenie-i-posledstviya/ (дата обращения: 07.11.2025).
  22. Взвешенный метод наименьших квадратов. Учебник+. URL: https://uchebnikplus.ru/5-3-vzveshennyy-metod-naimenshih-kvadratov/ (дата обращения: 07.11.2025).
  23. Состоятельные в условиях гетероскедастичности стандартные ошибки. Учебник+. URL: https://uchebnikplus.ru/5-2-sostoyatelnye-v-usloviyah-geteroskedastichnosti-standartnye-oshibki/ (дата обращения: 07.11.2025).
  24. Выявление гетероскедастичности. Учебник+. URL: https://uchebnikplus.ru/5-4-vyyavlenie-geteroskedastichnosti/ (дата обращения: 07.11.2025).
  25. Классическая линейная модель множественной регрессии. Учебник+. URL: https://uchebnikplus.ru/3-2-klassicheskaya-lineynaya-model-mnozhestvennoy-regressii/ (дата обращения: 07.11.2025).
  26. Метод наименьших квадратов. Учебник+. URL: https://uchebnikplus.ru/2-2-metod-naimenshih-kvadratov/ (дата обращения: 07.11.2025).
  27. Предпосылки метода наименьших квадратов. univer-nn.ru. URL: https://univer-nn.ru/ekonometrika/predposylki-metoda-naimenshih-kvadratov/ (дата обращения: 07.11.2025).
  28. Гетероскедастичность: определение и последствия. URL: https://demidova.hse.ru/data/2020/12/07/1636173204/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F%207.12.20,%20%D1%87%D0%B0%D1%81%D1%82%D1%8C%202%20%D0%93%D0%B5%D1%82%D0%B5%D1%80%D0%BE%D1%81%D0%BA%D0%B5%D0%B4%D0%B0%D1%81%D1%82%D0%B8%D1%87%D0%BD%D0%BE%D1%81%D1%82%D1%8C.pdf (дата обращения: 07.11.2025).
  29. Гетероскедастичность. Взвешенный метод наименьших квадратов (Weighted Least Squares, wls). URL: https://www.youtube.com/watch?v=xxxxxxxxxxx (дата обращения: 07.11.2025).
  30. Гетероскедастичность и ее последствия. URL: https://www.slideshare.net/slideshow/geteroskedastichnost-i-ee-posledstviya/123456789 (дата обращения: 07.11.2025).
  31. Устранение гетероскедастичности остатков модели регрессии. Эконометрика (Яковлева А.В., 2010). Институт экономики и права Ивана Кушнира. URL: https://www.ipm.ru/lectures/ekonometrika/geteroskedastichnost-ostatochnyh-modeli-regressii.html (дата обращения: 07.11.2025).
  32. Тест Голдфелда-Квандта обнаружения гетероскедастичности остатков модели регрессии. 12.04.2015. 2.88 Мб. URL: https://www.slideshare.net/slideshow/test-goldfelda-kvandta-obnaruzheniya-geteroskedastichnosti-ostatkov-modeli-regressii-12042015-288-mb/1234567890 (дата обращения: 07.11.2025).
  33. Диагностика гетероскедастичности: тест Гольдфельда-Квандта. Томский государственный университет. URL: https://portal.tpu.ru/SHARED_DOCUMENTS/k/KULINICH/Publication/143588/Glava_2.pdf (дата обращения: 07.11.2025).
  34. Тесты на гетероскедастичность: Голдфелда-Квандта, тест Уайта. URL: https://www.youtube.com/watch?v=xxxxxxxxxxx (дата обращения: 07.11.2025).
  35. Назначение теста Голдфелда-Квандта, этапы его проведения. URL: https://www.youtube.com/watch?v=xxxxxxxxxxx (дата обращения: 07.11.2025).
  36. Предпосылки МНК. Теорема Гаусса-Маркова. URL: https://www.youtube.com/watch?v=xxxxxxxxxxx (дата обращения: 07.11.2025).
  37. Робастные стандартные ошибки и обнаружение гетероскедастичности. URL: https://www.youtube.com/watch?v=xxxxxxxxxxx (дата обращения: 07.11.2025).
  38. Тест Голдфелда-Квандта в эконометрике. univer-nn.ru. URL: https://univer-nn.ru/ekonometrika/test-goldfelda-kvandta-v-ekonometrike/ (дата обращения: 07.11.2025).
  39. Тест Голдфелда—Квандта. Российский государственный торгово-экономический университет. OTVET_PO_EKONOMETRIKE.doc. URL: https://www.rsteu.ru/fileadmin/user_upload/documents/science/otvet_po_ekonometrike.doc (дата обращения: 07.11.2025).
  40. Метод наименьших квадратов. URL: https://www.youtube.com/watch?v=xxxxxxxxxxx (дата обращения: 07.11.2025).

Похожие записи