Пример готовой контрольной работы по предмету: Экономический анализ
Содержание
Содержание
Задача № 5 …………………………………………………………………… 3
Запишите и прокомментируйте формулу для каждой из указанных ниже величин, которые используются в однофакторном дисперсионном анализе.
Общий размер выборки, n.
Общее (главное) среднее, Х ̅.
Межгрупповая вариация и соответствующее число степеней свободы.
Внутригрупповая вариация и соответствующее число степеней свободы.
F – статистика и соответствующее число степеней свободы.
F — таблица.
Задача № 7………………………………………………………………….. 4
Была осуществлена проверка трех рекламных акций. В каждом случае использовались разные случайные выборки потребителей из одного и того же города. Оценки характеризуют эффективность рекламы; результаты приведены в следующей таблице:
Реклама — 1 Реклама — 2 Реклама — 3
Среднее 63,2 68,1 53,5
Стандартное отклонение 7,9 11,3 9,2
Размер выборки (потребителей) 101 97 105
Какая реклама оказалась наиболее, а какая наименее эффективной?
Определите общий объем выборки, n, общее среднее, X ̅, и число выборок k.
Вычислите межгрупповую вариацию и число степеней свободы для нее.
Вычислите внутригрупповую вариацию и число степеней свободы для нее.
Задача № 16………………………………………………………………….. 5
Чтобы лучше распределять свое рабочее время, вы провели небольшое исследование, фиксируя время, затраченное на каждый
телефонный звонок (в минутах) в течение одного рабочего
дня. Перед тем как внести изменения в организацию своей работы (например, переадресовать некоторые звонки своим подчиненным), вы хотите разобраться в этой ситуации. Продолжительность звонков, сгруппированных по определенным темам, приведена в следующей таблице:
Информация Продажи Обслуживание Остальные
0,6 5,1 5,2 6, 3
1,1 1,7 2,9 1,2
1,0 4,4 2,6 3,1
1,9 26,6 1,2 2,5
3,8 7,4 7,0 3,0
1,6 1,4 14,2 2,6
0,4 7,0 8,4 0,8
0,6 3,9 0,6
2,2 3,1 26,7
12,3 1,2 7,7
4,2 1,9 4,8
2,8 17,3 7,2
1,4 7,8 2,7
4,3 3,4
3,4 13,3
1,3
2,0
1) Постройте в одном масштабе блочные диаграммы для этих четырех видов звонков и опишите полученную структуру.
2) Вычислите среднее и стандартное отклонения для каждого вида телефонных звонков.
3) Какой из типов звонков имеет наибольшую среднюю продолжительность, а какой наименьшую?
4) Выполняется ли для данного набора данных необходимое для однофакторного дисперсионного анализа предположение о нормальном распределении и равной вариации? Почему?
5) Вычислите для каждого значения натуральный логарифм и постройте блочные диаграммы для этих логарифмов.
6) Можно ли сказать, что предположение о равной вариации лучше выполняется для логарифмов, чем для исходных данных?
Задача № 20………………………………………………………………….. 9
Проверяются различия качества сырья трех поставщиков на некотором производстве: Amalgamated (поставщик A), Bipolar (поставщик B) и Consolidated (поставщик C).
Вам поручено собрать и проанализировать данные об этом качестве в виде его оценок 5- ю случайно выбранными работниками каждой из трех смен предприятия по 100-балльной шкале (оценка — неотрицательное целое число).
Представьте, что данные собраны. Заполните ими следующую таблицу (у каждого решающего задачу — свои данные; заранее допустив значимые различия в качестве сырья каких-то из поставщиков A, B, C, можно смоделировать эти различия исходными данными; можно обдумать причины, по которым оценки качества сырья взятого поставщика значимо разнятся в сменах, и смоделировать также действие этих причин):
Дневная смена Ночная смена Пересменка
A B C A B C A B C
Двухфакторный дисперсионный анализ качества продукции
Источник вариации DF SS MS F p
Смена
Поставщик
Смена X поставщик
Ошибка
Итого
1) Создайте таблицу средних значений качества для выбранной комбинации поставщика и смены в виде
Дневная смена Ночная смена Пересменка Среднее
Поставщик A
Поставщик B
Поставщик C
Среднее
и выполните при помощи этой таблицы однофакторный дисперсионный анализ (ANOVA), выбрав в качестве признака средний показатель качества сырья в ячейке, а в качестве фактора — переменную «фирма-поставщик». Почему по этим данным нельзя выполнить двухфакторный дисперсионный анализ (убедитесь в этом в среде SPSS)?
2) В дополнение к проведенному однофакторному дисперсионному анализу (ANOVA) выполните множественный регрессионный анализ с индикаторными (фиктивными) переменными (см. тему «Множественная регрессия»).
С этой целью создайте зависимую переменную Y, поместив средние в сменах оценки качества сырья в одном длинном столбце, например, для удобства ввода данных в алфавитном порядке по поставщику: сначала оценки сырья Amalgamated (поставщик A), затем Bipolar (поставщик B) и, далее, Consolidated (поставщик C).
3) Далее, создайте две индикаторные переменные X1, X2 для введения в модель регрессии качественного предиктора «компания-поставщик», со следующей таблицей кодирования:
X₁ X2
Amalgamated 1 0
Bipolar 0 1
Consolidated 0 0
Постройте уравнение регрессии и проведите тестирование значимости влияния предиктора на зависимую переменную.
4) Сравните результат F- теста, полученный из регрессионного анализа, с результатом F- теста, полученным из однофакторного дисперсионного анализа. Дают ли эти два метода — множественная регрессия и однофакторный дисперсионный анализ — разные результаты, или результаты полностью совпадают? Как вы думаете, почему это именно так?
5) Сравните коэффициенты регрессии (наклоны) для индикаторных переменных в уравнении регрессии с разностями средних значений оценок качества для разных поставщиков (эти средние значения содержатся в последнем столбце «Среднее» в таблице средних).
Прокомментируйте полученный результат.
6) Выполните двухфакторный дисперсионный анализ исходных данных и заполните соответствующую таблицу, приведенную выше. Прокомментируйте полученные результаты в аспекте значимости влияния на показатели качества сырья факторов «смена» и «поставщик» и их взаимодействия. Классифи-цируйте тип взаимодействия и проиллюстрируйте его графически.
Задача № 26………………………………………………………………….. 14
Объедините размеры годовой заработной платы в три группы в
соответствии с уровнем квалификации служащих ( А, В и С) и
1) Для сравнения этих трех групп постройте блочные диаграммы и прокомментируйте их.
2) Найдите среднее значение для каждого уровня квалификации и прокомментируйте его.
3) Найдите межгрупповую и внутригрупповую вариацию и соответствующие им степени свободы.
4) Найдите значение F — статистики и количество степеней свободы для нее.
5) Выполните F — тест на уровне 0,05 и представьте результаты.
6) Изложите результаты теста наименьшего значимого различия, если он может быть применен (тест наименьшего значимого различия — в точности то же, что и предусмотренный в SPSS сравнительный анализ влияния различных уровней фактора на исследуемый признак, см. Лекцию 2, стр.18 и примеры из Case Studies в SPSS).
7) Обобщите, что вы узнали из базы данных относительно этой проблемы.
Задача № 35………………………………………………………………….. 17
Представьте себе, что данные в однофакторном эксперименте
распределены по четырем группам, каждая из которых состоит
из восьми элементов.
Заполните пропуски в приводимой ниже сводной таблице ANOVA, объяснив, чем в ней являются величины c и n .
Вид вариативности Количество степеней свободы Сумма квад-ратов Дисперсия F — статистика
Межгрупповая вариативность признака c -1 = ? SSA = ? MSA = 80 F = ?
Внутригрупповая вариативность признака n — c = ? SSW = 560 MSW = ?
Полная вариативность признака n -1 = ? SST = ?
Задача № 42………………………………………………………………….. 18
☼ Компания, производящая шариковые авторучки, наняла рекламное агентство, чтобы организовать общенациональную рекламную кампанию. Для начала директор компании решил исследовать влияние рекламы на восприятие их продукции. Был организован эксперимент, в котором сравнивались пять видов рекламы шариковых авторучек. В рекламе А свойства авторучек были сильно занижены, в рекламе Б — занижены умеренно, в рекламе В — слегка преувеличены, в рекламе Г — сильно преувеличены, и лишь в рекламе Д характеристики ручек описывались объективно. Из крупной фокус — группы была извлечена выборка, в которую были включены 30 респондентов, случайным образом распределенные по пяти группам, соответствующим разным видам рекламы (по шесть человек в группе).
Прочитав рекламное объявление и сформировав свое представление о продукции компании, респонденты получали авторучки одного и того же вида, испытывали их и оценивали достоверность рекламных обещаний. Респондентов просили оценить внешний вид, долговечность и качество авторучек по семибалльной шкале. Суммарный рейтинг рекламы, учитывающий баллы по каждому из показателей (внешний вид, долговечность и качество), поставленные каждым из 30 респондентов, приведены в файле ☼ PEN . XLS.
1) Существует ли статистически значимая разница между средними рейтингами разных рекламных объявлений, если уровень значимости равен 0,05?
2) Определите, рейтинг какого рекламного объявления отличается от среднего, если это возможно.
3) Существует ли статистически значимая разница между дисперсиями рейтингов разных рекламных объявлений, если уровень значимости равен 0,05?
4) Как результат решения пункта 3 влияет на корректность результатов решения пунктов 1 и 2?
Задача № 44………………………………………………………………….. 20
Компания, производящая спортивные товары, желает сравнить расстояние, которое пролетают мячи для гольфа, изготовленные по четырем разным технологиям. По каждой технологии было произведено по десять мячей. Затем эти мячи были переданы местному гольф-клубу для испытаний. Порядок следования мячей был случайным. Все
4. мячей были испытаны в течение короткого отрезка времени при одинаковых погодных условиях. Результаты испытания (в ярдах) приведены в таблице:
Технология
1 2 3 4
206,32 203,81 217,08 213,90
226,77 223,85 230,55 231,10
207,94 206,75 221,43 221,28
224,79 223,97 227,95 221,53
206,19 205,68 218,04 229,43
229,75 234,30 231,84 235,45
204,45 204,49 224,13 213,54
228,51 219,50 224,87 228,35
209,65 210,86 211,82 214,51
221,44 233,00 229,49 225,09
1) Можно ли утверждать, что среднее расстояние, которое пролетают мячи для гольфа, произведенные по разным технологиям, неодинаково, если уровень значимости равен 0,05?
2) Если среднее расстояние, которое пролетают мячи для гольфа, произведенные по разным технологиям, неодинаково, примените процедуру Тьюки-Крамера и определите отличающиеся группы.
3) Какие условия должны выполняться при решении пункта
1. Выполняются ли эти условия?
4) Какую технологию следует предпочесть? Обоснуйте свою рекомендацию.
Исходя из того, что тест Левенэ оказался значимым, мы сделали вывод о том, что дисперсии рейтингов разных рекламных сообщений равны, следовательно, результаты проведенного анализа корректны.
Задача № 45………………………………………………………………….. 22
Допустим, что при двухфакторном эксперименте факторы А и В имеют по три уровня. В каждой из девяти ячеек (cells), соответствующих комбинациям уровней факторов А и В, находятся по четыре реплики.
1) Сколько степеней свободы существует при определении вариации фактора А?
2) Сколько степеней свободы существует при определении вариации фактора В?
3) Сколько степеней свободы существует при определении вариации взаимодействия факторов?
4) Сколько степеней свободы существует при определении вариации случайной ошибки?
5) Сколько степеней свободы существует при определении полной вариации?
Задача № 46………………………………………………………………….. 23
Рассмотрим эксперимент, описанный в задаче 45.
1) Предположим, что SSA = 120 , SSB = 110 , SSE = 270 и SST = 540. Чему равна величина SSAB?
2) Чему равна величина MSA?
3) Чему равна величина MSB?
4) Чему равна величина MSAB?
5) Чему равна величина MSE?
6) Чему равна F — статистика для эффекта взаимодействия?
7) Чему равна F- статистика для эффекта фактора А?
8) Чему равна F- статистика для эффекта фактора В?
9) Заполните сводную таблицу дисперсионного анализа.
Задача № 53………………………………………………………………….. 24
Студенты, изучающие статистику, провели факторный эксперимент, в ходе которого измерялось время растворения болеутоляющих таблеток в стакане воды. В эксперименте исследовались два фактора: торговая марка (Equate, KROGER, Alka-Seltzer) и температура воды (теплая или холодная).
Продолжительность растворения (в секундах) 24 таблеток приведены таблице, см. файл PAIN-RELIEF.XLS.
Торговая марка
Вода EQUATE KROGER ALKA-SELTZER
Холодная 85,87 75, 98 100,11
78, 69 87, 66 99, 65
76,42 85,71 100,83
74,43 86,31 94,16
Горячая 21,53 24,10 23,80
26,26 25,83 21,29
24, 95 26,32 20,82
21,52 22, 91 23,21
1) Существует ли статистически значимый эффект взаимодействия между разновидностью таблетки и временем ее растворения, если уровень значит равен 0,05?
2) Существует ли статистически значимый эффект разновидности таблетки, если уровень значимости равен 0,05?
3) Существует ли статистически значимый эффект температуры воды, уровень значимости равен 0,05?
4) Постройте график средней продолжительности растворения таблеток каждой разновидности при двух температурах воды.
5) Объясните результаты решения п.п. 1 и 3.
Задача № 55………………………………………………………………….. 27
В одном из экспериментов исследовалась прочность автомобильных шин, зависящая от длины шипов и вида установки. Данные помещены в следующую таблицу (файл GEAR.XLS).
Установка
Длина шипов НИЗКАЯ ВЫСОКАЯ
Короткие
18,0 13,5
16,5 8,5
26,0 11,5
22,5 16, 0
21,5 -4,5
21,0 4,0
30,0 1,0
24,5 9,0
Длинные
27,5 17,5
19,5 11,5
31,0 10,0
27,0 1,0
17,0 14,5
14,0 3,5
18,0 7,5
17,5 6,5
1) Существует ли статистически значимый эффект взаимодействия между установкой шины и длиной шипов, если уровень значимости равен 0,05?
2) Существует ли статистически значимое влияние длины шипов на прочность шины, если уровень значимости равен 0,05?
3) Существует ли статистически значимое влияние вида установки шины на ее прочность, если уровень значимости равен 0,05?
4) Постройте график средней прочности шин для каждого вида шипов при разных видах установки.
5) Объясните результаты решения п. п. 1-4.
Выдержка из текста
Контрольная работа по дисциплине "Анализ данных"
Тема: «Дисперсионный анализ».
С подробным решением и графиками
Сдана на отлично
Список использованной литературы
лекции