Главная » Бесплатные рефераты » Бесплатные рефераты по эконометрике »
Тема: Решение задачи в Statgraphics Plus
Раздел: Бесплатные рефераты по эконометрике
Тип: Лабораторная работа | Размер: 32.68K | Скачано: 309 | Добавлен 05.05.11 в 12:08 | Рейтинг: +3 | Еще Лабораторные работы
РЕШЕНИЕ ЗАДАЧИ В Statgraphics Plus
1. Подготовка данных для использования пакета Statgraphics Plus
Данные могут быть введены непосредственно в Statgraphics Plus или могут быть импортированы из текстовых файлов.
№ Y X1 X2 X3
1 74 33 56 10
2 84 34 58 8
3 73 36 67 7
4 93 35 70 9
5 56 33 73 8
6 71 37 77 7
7 117 39 78 12
8 111 42 99 9
9 135 43 93 13
10 125 44 96 12
Для импортирования файла в главное меню необходимо найти и выполнить команду чтения файла с исходными данными: File\ Open\ Open Data File
В появившемся окне указать имя папки, тип файла All Files \ имя файла Вариант Х \ Открыть. В новом появившемся окне Read ASCII File нажать кнопку tab defimited и клавишу OK .
В нижней левой части экрана появится командное меню с надписью Вари…Нажав клеточную клавишу вызвать команду Развернуть. При этом на экране появится таблица с данными варианта задания:
|
Col 1 |
Col 2 |
Col 3 |
Col 4 |
Col 5 |
1 |
№ |
Y |
X1 |
X2 |
X3 |
2 |
1 |
74 |
33 |
56 |
10 |
3 |
2 |
84 |
34 |
58 |
8 |
4 |
3 |
73 |
36 |
67 |
7 |
5 |
4 |
93 |
35 |
70 |
9 |
6 |
5 |
56 |
33 |
73 |
8 |
7 |
6 |
71 |
37 |
77 |
7 |
8 |
7 |
117 |
39 |
78 |
12 |
9 |
8 |
111 |
42 |
99 |
9 |
10 |
9 |
135 |
43 |
93 |
13 |
11 |
10 |
125 |
44 |
96 |
12 |
2) Редактировать данные
Убрать с экрана лишние надписи путем удаления соответствующих строк и колонок таблицы данных. Для удаления необходимо мышью пометить удаляемые данные, нажатием правой клавиши мышки вызвать контекстное меню и выполнить команду Delete. В рассматриваемом примере необходимо убрать первую колонку с порядковыми номерами и первую строку с идентификаторами переменных. При этом необходимо запомнить размещение данных во вновь полученной таблице:
|
Col_1[1] |
Col_2 |
Col_3 |
Col_4 |
1 |
507,20 |
19,50 |
359,90 |
448,10 |
2 |
506,60 |
19,80 |
187,10 |
451,90 |
3 |
487,80 |
21,10 |
375,20 |
447,90 |
4 |
496,00 |
18,60 |
287,90 |
444,30 |
5 |
493,60 |
19,60 |
444,00 |
443,20 |
6 |
458,90 |
11,70 |
462,40 |
411,70 |
7 |
429,30 |
10,50 |
459,50 |
328,60 |
8 |
386,90 |
13,60 |
511,30 |
314,70 |
9 |
311,50 |
10,80 |
328,60 |
259,40 |
10 |
302,20 |
10,90 |
350,00 |
187,70 |
11 |
262,00 |
10,30 |
298,70 |
238,50 |
12 |
242,20 |
10,60 |
529,30 |
269,40 |
13 |
231,90 |
8,50 |
320,00 |
284,00 |
|
214,30 |
6,70 |
502,00 |
172,30 |
|
208,40 |
8,30 |
194,90 |
166,40 |
В первой колонке содержатся данные зависимой переменной Y, а во второй, третьей и четвертой колонках – соответственно X1, X2 и Х3.
3) Сохранить данные.
Каждой переменной в файле данных Statgraphics Plus будет соответствовать отдельная колонка. Используя меню File/ SAVE/ Save Date File As…, сохраните данный файл с расширением, <имя файла>.sf3 или с расширением .txt.
2. Решение задач в Statgraphics Plus
2.1. Выбор факторных признаков для построения регрессионной модели на основе анализа матрицы коэффициентов корреляции.
Для построения матрицы парной корреляции всех переменных с помощью пакета Statgraphics Plus необходимо выполнить следующие действия:
1) в главном меню выбрать и нажать клавишу Symmary stats. При этом на экране появится диалоговое окно Multiple-Variable Analysis;
|
CMAT_1 |
CMAT_2 |
CMAT_3 |
CMAT_4 |
1 |
1,0 |
0,883818 |
0,0288061 |
0,937679 |
2 |
0,883818 |
1,0 |
0,181598 |
0,888499 |
3 |
0,0288061 |
0,181598 |
1,0 |
0,0333198 |
4 |
0,937679 |
0,888499 |
0,0333198 |
1,0 |
Значения коэффициентов парной корреляции указывают на весьма тесную связь зависимой переменной y с факторными переменными x1, x2 и х3. В то же время межфакторная связь rx1x2 =0,921 весьма тесная и превышает тесноту связи x2 с y, что свидетельствует о наличии мультиколлинеарности. В связи с этим для улучшения разрабатываемой модели необходимо исключить из ее структуры фактор x2 как малоинформативный и недостаточно статистически надежный.
Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух переменных, чем коэффициенты парной корреляции, т.к. очищают парную зависимость от воздействия других переменных.
5) Для отображения на экране результатов вычисления линейных коэффициентов частной корреляции необходимо в окне табличных настроек Tabular options поставить флажок напротив Partial Correlations, а в подменю Save results в окне Partial Correlations установить флажок и нажать ОК. Файлу будет приписан идентификатор PMAT. Матрица коэффициентов частной корреляции будет продолжением матрицы коэффициентов парной корреляции с колонками PMAT_1, PMAT_2, PMAT_3 и PMAT_4. Матрица коэффициентов частной корреляции для рассматриваемого примера имеет вид:
|
PMAT_1 |
PMAT_2 |
PMAT_3 |
PMAT_4 |
1 |
|
0,3394 |
0,125615 |
0,684299 |
2 |
0,3394 |
|
-0,351905 |
0,383612 |
3 |
0,125615 |
-0,351905 |
|
0,119295 |
4 |
0,684299 |
0,383612 |
0,119295 |
|
Как следует из полученной матрицы, наиболее тесно связан y с факторами x1, x3, коэффициенты частной корреляции равны ryx1.x2=0,712, ryx3.x2=0,737. Связь y с фактором x2 гораздо слабее и равна ryx2.x1=-0,371. Межфакторная зависимость x1 и x2, равная rx1x2.y=0,855 выше, чем парная y и x2: ryx2.x1= =-0,371.
Все это приводит к выводу о необходимости исключить фактор x2 из правой части уравнения множественной регрессии.
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи между анализируемыми переменными.
На основе анализа матрицы коэффициентов парной корреляции делаем вывод о целесообразности построения двухфакторного регрессионного уравнения y=f(x2 y)
2.2. Построение линейного уравнения регрессии.
По заданию необходимо построить регрессионную модель со значимыми факторами в линейной форме.
Оценку параметров уравнения регрессии необходимо осуществить по методу наименьших квадратов. Для проведения регрессионного анализа с помощью пакета Statgraphics Plus выполнить следующие действия:
Multiple Regression Analysis
-----------------------------------------------------------------------------
Dependent variable: Col_3
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 427,592 85,3512 5,00979 0,0002
Col_2 -4,00536 6,01557 -0,665832 0,5172
-----------------------------------------------------------------------------
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 5448,7 1 5448,7 0,44 0,5172
Residual 159775,0 13 12290,4
-----------------------------------------------------------------------------
Total (Corr.) 165223,0 14
R-squared = 3,29778 percent
R-squared (adjusted for d.f.) = 0,0 percent
Standard Error of Est. = 110,862
Mean absolute error = 90,2232
Durbin-Watson statistic = 2,3116
В первой колонке Parameter перечисляются используемые в модели независимые переменные, а во второй колонке Estimate содержатся коэффициенты уравнения регрессии.
По результатам вычислений составим уравнение множественной регрессии вида:
y = 427,592 - 4,00536* x2
Значения случайных ошибок параметров уравнения регрессии записаны в колонке Standard Error:
mb0=85,3512; mb1= 6,01557;
Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения использованы при расчетном определении t- критерия Стьюдента, приведенные в колонке T Statistic:
tb0=5,00979 tb1=-0,665832
Если расчетное значение критерия больше табличного значения, то можно делать вывод о существенности данного параметра, который формируется под воздействием неслучайных величин x1 и x3. В противном случае принимается гипотеза о случайной природе значения коэффициента уравнения, и соответствующая переменная исключается из структуры модели как неинформативный фактор.
Табличное значение t-критерия Стьюдента для уровня значимости α=0,05 и числа степеней свободы f=13 равно tт=2,16
В рассматриваемом примере расчетные значения t-критерия Стьюдента больше табличного значения tт=2,16, что подтверждает статистическую значимость параметров b0 , b1 .
Величина b0 оценивает агрегированное влияние неучтенных факторов на результирующую переменную y. Величины b1 , b3 указывают, что с увеличением x1 и x3 на единицу их значений результирующая переменная увеличиться соответственно на 4,00536. Сравнивать эти значения между собой не следует, т.к. они зависят от единицы измерения каждого признака и поэтому не сопоставимы между собой.
2) Оценить надежность уравнения регрессии в целом и коэффициента детерминации.
Во второй таблице Analysis of Variance приводятся результаты дисперсионного анализа. В первой строке таблицы Model приводится дисперсия регрессии, во второй Residual – дисперсия остатка, а в третьей - Total (Corr.) – общая дисперсия. Колонки слева на право содержат: сумму квадратов – Sum of Squares, число степеней свободы – Df, оценку дисперсии – Mean Square, расчетный критерий Фишера – F-Ratio.
Оценку надежности уравнения регрессии в целом и коэффициента детерминации дает расчетное значение F - критерия Фишера, равное Fр=0,44 . Сравнение расчетного значения критерия с табличным позволяет проверить гипотезу об адекватности модели и значимости коэффициента детерминации. Табличное значение F – критерия Фишера для уровня значимости α=0,05 и числа степеней свободы f1=1, f2=13 равно Fт=4,67. Расчетное значение F - критерия Фишера больше табличного значения Fр=0,44 больше Fт=4,74. Значит модель неадекватна.
Уравнение регрессии следует признать неадекватным, модель считается незначимой.
В нижней части таблицы приводятся:
Коэффициент детерминации R-squared в процентах;
R-squared = 3,29778 percent
Нормированный коэффициент R-квадрат R-squared(adjusted for d.f.);
R-squared (adjusted for d.f.) = 0,0 percent
Стандартная ошибка Standard Error of Est.;
Standard Error of Est. = 110,862
Среднее значение абсолютной ошибки Mean absolute error;
Mean absolute error = 90,2232
Статистика Дурбина – Ватсона Durbin-Watson statistic- 2,3116
Коэффициент детерминации R-squared R2= 3,29778 % показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 3,29% вариации зависимой переменной учтено в модели и обусловлено вариацией включенных факторов.
Коэффициент множественной корреляции R=6,01557 показывает тесноту связи зависимой переменной y со всеми включенными в модель объясняющими факторами x1, x3.
Скорректированный коэффициент детерминации R-squared(adjusted for d.f.) равен 0,0 %. Он определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсии и позволяет сравнивать модели с разным числом факторов. Оба коэффициента детерминации указывают на высокую детерминированность результатов y факторами x1 и x3.
Статистика Дурбина – Ватсона Durbin-Watson statistic=2,3116 используется при проверке коррелированности остатков модели.
2.3. Расчет частных коэффициентов эластичности
1) Для получения статистических оценок по исходным данным и результатам вычислений необходимо вызвать из главного меню Statgraphics Plus программу Summary ststis. При этом на экране появится диалоговое окно Multiple-Variable Analysis. Заполнить диалоговое окно ввода данных идентификаторами колонок, в которых содержатся данные для анализа. В рассматриваемом примере необходимо ввести: Col_2, Col_3. Нажать кнопку OK.
2) В появившемся подменю Multiple-Variable Analysis выбрать и нажать клавишу Tabular options. В окне табличных настроек поставить флажок напротив Summary ststistics, нажать клавишу OK.. При этом на экране появится таблица со статистическими данными переменных, записанных в колонках Col_2, Col_3:
Summary Statistics
Col_2 Col_3
Count 15 15
Average 13,3667 374,053
Variance 24,2595 11801,7
Standard deviation 4,9254 108,635
Minimum 6,7 187,1
Maximum 21,1 529,3
Stnd. skewness 0,756068 -0,36014
Stnd. kurtosis -1,14019 -0,675618
Sum 200,5 5610,8
Строки таблицы в порядке следования сверху вниз содержат следующие статистические данные по каждой переменной: количество наблюдений, среднее значение, дисперсия, стандартное отклонение, минимальное значение, максимальное значение, коэффициент асимметрии, коэффициент крутизны, сумма.
Средние значения Average использовать для расчета коэффициентов эластичности регрессионной модели.
3) Рассчитать частные коэффициенты эластичности по формулам:
где bi – коэффициент регрессии при xi в уравнении множественной регрессии;
среднее значение i-го фактора;
- среднее значение результирующей переменной.
Для решаемой задачи получаем:
Эyx1=(6,01557∙- 0,4)/ 374 =169,167 ,
По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результирующий признак y фактора x1. При изменении на 1% факторной переменной x1 результирующая переменная y измениться на 1,4%.
2.4. Построение прогноза
1) Для построения прогноза вначале необходимо ввести прогнозные значения выбранных факторов x1=38 и x3=10 в таблицу с исходными данными:
|
Col_1[1] |
Col_2 |
Col_3 |
Col_4 |
1 |
74 |
33 |
56 |
10 |
2 |
84 |
34 |
58 |
8 |
3 |
73 |
36 |
67 |
7 |
4 |
93 |
35 |
70 |
9 |
5 |
56 |
33 |
73 |
8 |
6 |
71 |
37 |
77 |
7 |
7 |
117 |
39 |
78 |
12 |
8 |
111 |
42 |
99 |
9 |
9 |
135 |
43 |
93 |
13 |
10 |
125 |
44 |
96 |
12 |
11 |
|
38 |
|
10 |
2) Рассчитать прогнозируемое значение результирующей переменной (точечный прогноз), для чего в меню программы Multiple regression нажать клавишу Save results.. В окне сохранения результатов Save results Options поставить флажок напротив прогнозное значение - Predicted Values, нажать клавишу OK..В окне табличных данных появится колонка прогноза - Predicted с рассчитанными по регрессионной модели данными:
Predicted
80,1464
72,0052
73,3791
81,5203
68,3756
77,0087
113,695
106,928
134,099
131,843
98,2946
Последняя строка таблицы содержит прогнозное значение результирующей переменной:
3) Определить интервальные значения прогнозируемой переменной для уровня значимости α=0,05.
В окне сохранения результатов Save results Options поставить два флажка напротив нижний предел - Lower Limits for Predictions и верхний предел Upper Limits for Predictions, нажать клавишу OK. В окне табличных данных появятся колонки прогноза - Predicted с интервальными значениями: нижним пределом - Lower Plims и верхним пределом - Upper Plims рассчитанными для уровня значимости α=0,05.
Predicted Lower Plims Upper Plims
80,1464 54,65 105,643
72,0052 48,6046 95,4058
73,3791 49,1401 97,618
81,5203 58,4868 104,554
68,3756 44,4929 92,2583
77,0087 52,3479 101,67
113,695 89,3879 138,002
106,928 81,6375 132,218
134,099 108,674 159,523
131,843 106,727 156,959
98,2946 75,6931 120,896
Для рассматриваемого примера интервальный прогноз находится в нижней строке таблицы:
2.5. Запись результатов вычислений в рабочую папку и завершение работы с программой Statgraphics Plus.
1) Результаты вычислений, отображаемые в окне пакета программ Statgraphics Plus записывать в свою папку в виде отдельных фалов. Для записи содержимого экрана необходимо выполнить следующую последовательность команд:
File\ Save As\ Save StatFollio As…\ далее укажите <имя папки> для записи, тип файла StatFollios \ *.sgp \< имя файла >.
ПОРЯДОК ВЫПОЛНЕНИЯ И ОФОРМЛЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ
В ходе выполнения лабораторной работы требуется:
1. Получить решение задачи с помощью пакета программ
Statgraphics Plus;
2. Составить папку с протоколом решения (экспресс-отчет). Сохранить протокол на диске D в папке Эконометрика с имени файла: прИванов И_И
Протокол решения должен содержать:
При решении приведенных типовых задач регрессионного анализа с помощью программы Statgraphics Plus могут использоваться разнообразные подходы к оформлению результатов решения. В каждой конкретной ситуации студенты могут выбрать свой подход - с позиций содержательности, наглядности, удобства, дизайна.
3. Оформить лабораторную работу в полном объеме. Оформление проводится студентом самостоятельно во время или после занятий в установленные преподавателем сроки. Файл с результатами решения сохраняется на диске D в папке Эконометрика с имени файла: лрИванов И_И
Полный отчет по лабораторной работе должен содержать:
Желательный объем указанного отчета – 3-7 страниц. При отсутствии необходимого объема учебного времени по указанию преподавателя возможен экспресс-отчет (для студентов, посетивших все занятия и самостоятельно выполнивших аудиторную работу в присутствии преподавателя).
К зачету допускаются студенты, выполнившие все пункты задания и оформившие результаты в установленном порядке.
Зачет по лабораторной работе каждый студент сдает персонально преподавателю, ведущему занятия в данной группе.
Для получения зачета студент должен:
- знать теоретические основы тематики лабораторной работы в объеме содержания материалов учебного - методического пособия и лекций;
- уметь ответить на конкретные вопросы по содержанию выполненной лабораторной работы.
Номер Вашего варианта задания будет задан преподавателем во время выполнения лабораторной работы.
Данные к задачам в текстовом формате будут размещены на диске D в папке Эконометрика.
Вариант 10. Установите направление и характер взаимосвязи между четырьмя факторами по 15 банкам зарубежной страны (табл. 10).
Таблица 10
№ пп X1 X2 Х3 X4
1 507,2 19,5 359,9 448,1
2 506,6 19,8 187,1 451,9
3 487,8 21,1 375,2 447,9
4 496 18,6 287,9 444,3
5 493,6 19,6 444 443,2
6 458,9 11,7 462,4 411,7
7 429,3 10,5 459,5 328,6
8 386,9 13,6 511,3 314,7
9 311,5 10,8 328,6 259,4
10 302,2 10,9 350 187,7
11 262 10,3 298,7 238,5
12 242,2 10,6 529,3 269,4
13 231,9 8,5 320 284
14 214,3 6,7 502 172,3
15 208,4 8,3 194,9 166,4
Обозначения:
Х1 - суммарный актив, млрд. дол;
Х2 - объем вложений акционеров, млрд. дол;
Х3 - чистый доход, млрд. дол;
Х4 - депозиты, млрд. дол.
Задание
1. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны.
2. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.
3. Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.
4. Отберите информативные факторы. Постройте уравнение регрессии со статистически значимыми факторами. Рассчитайте коэффициенты эластичности.
5. Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
6. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (а = 0,05; а = 0,10).
Вариант 11. Имеются данные о посевной площади зерновых культур,
валовом сборе и внесении минеральных удобрений на 1 га посевной площади (табл.11). Обоснуйте выбор результирующего и факторных признаков. Постройте множественное уравнение регрессии, проанализируйте полученные результаты.
|
CMAT_1 |
CMAT_2 |
CMAT_3 |
CMAT_4 |
1 |
1,0 |
0,883818 |
0,0288061 |
0,937679 |
2 |
0,883818 |
1,0 |
0,181598 |
0,888499 |
3 |
0,0288061 |
0,181598 |
1,0 |
0,0333198 |
4 |
0,937679 |
0,888499 |
0,0333198 |
1,0 |
Значения коэффициентов парной корреляции указывают на весьма тесную связь зависимой переменной y с факторными переменными x1, x2 и х3. В то же время межфакторная связь rx1x2 =0,921 весьма тесная и превышает тесноту связи x2 с y, что свидетельствует о наличии мультиколлинеарности. В связи с этим для улучшения разрабатываемой модели необходимо исключить из ее структуры фактор x2 как малоинформативный и недостаточно статистически надежный.
Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух переменных, чем коэффициенты парной корреляции, т.к. очищают парную зависимость от воздействия других переменных.
5) Для отображения на экране результатов вычисления линейных коэффициентов частной корреляции необходимо в окне табличных настроек Tabular options поставить флажок напротив Partial Correlations, а в подменю Save results в окне Partial Correlations установить флажок и нажать ОК. Файлу будет приписан идентификатор PMAT. Матрица коэффициентов частной корреляции будет продолжением матрицы коэффициентов парной корреляции с колонками PMAT_1, PMAT_2, PMAT_3 и PMAT_4. Матрица коэффициентов частной корреляции для рассматриваемого примера имеет вид:
|
PMAT_1 |
PMAT_2 |
PMAT_3 |
PMAT_4 |
1 |
|
0,3394 |
0,125615 |
0,684299 |
2 |
0,3394 |
|
-0,351905 |
0,383612 |
3 |
0,125615 |
-0,351905 |
|
0,119295 |
4 |
0,684299 |
0,383612 |
0,119295 |
|
Как следует из полученной матрицы, наиболее тесно связан y с факторами x1, x3, коэффициенты частной корреляции равны rx2x2=0,3394 x3.x2=0,737. Связь y с фактором x2 гораздо слабее и равна ryx2.x1=-0,371. Межфакторная зависимость x1 и x2, равная rx1x2.y=0,855 выше, чем парная y и x2: ryx2.x1= =-0,371.
Все это приводит к выводу о необходимости исключить фактор x2 из правой части уравнения множественной регрессии.
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи между анализируемыми переменными.
На основе анализа матрицы коэффициентов парной корреляции делаем вывод о целесообразности построения двухфакторного регрессионного уравнения y=f(x1, x3).
Внимание!
Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы
Понравилось? Нажмите на кнопочку ниже. Вам не сложно, а нам приятно).
Чтобы скачать бесплатно Лабораторные работы на максимальной скорости, зарегистрируйтесь или авторизуйтесь на сайте.
Важно! Все представленные Лабораторные работы для бесплатного скачивания предназначены для составления плана или основы собственных научных трудов.
Друзья! У вас есть уникальная возможность помочь таким же студентам как и вы! Если наш сайт помог вам найти нужную работу, то вы, безусловно, понимаете как добавленная вами работа может облегчить труд другим.
Если Лабораторная работа, по Вашему мнению, плохого качества, или эту работу Вы уже встречали, сообщите об этом нам.
Добавить отзыв могут только зарегистрированные пользователи.