Главная » Бесплатные рефераты » Бесплатные рефераты по эконометрике »

Решение задачи в Statgraphics Plus

Тема: Решение задачи в Statgraphics Plus

Раздел: Бесплатные рефераты по эконометрике

РЕШЕНИЕ ЗАДАЧИ В Statgraphics Plus

1. Подготовка данных для использования пакета Statgraphics Plus

Данные могут быть введены непосредственно в Statgraphics Plus или могут быть импортированы из текстовых файлов.

ввести исходные данные или открыть существующий текстовый файл с анализируемыми данными:

№ Y X1 X2 X3

1 74 33 56 10

2 84 34 58 8

3 73 36 67 7

4 93 35 70 9

5 56 33 73 8

6 71 37 77 7

7 117 39 78 12

8 111 42 99 9

9 135 43 93 13

10 125 44 96 12

Для импортирования файла в главное меню необходимо найти и выполнить команду чтения файла с исходными данными: File\ Open\ Open Data File

В появившемся окне указать имя папки, тип файла All Files \ имя файла Вариант Х \ Открыть. В новом появившемся окне Read ASCII File нажать кнопку tab defimited и клавишу OK .

В нижней левой части экрана появится командное меню с надписью Вари…Нажав клеточную клавишу вызвать команду Развернуть. При этом на экране появится таблица с данными варианта задания:

	Col 1	Col 2	Col 3	Col 4	Col 5
1	№	Y	X1	X2	X3
2	1	74	33	56	10
3	2	84	34	58	8
4	3	73	36	67	7
5	4	93	35	70	9
6	5	56	33	73	8
7	6	71	37	77	7
8	7	117	39	78	12
9	8	111	42	99	9
10	9	135	43	93	13
11	10	125	44	96	12

2) Редактировать данные

Убрать с экрана лишние надписи путем удаления соответствующих строк и колонок таблицы данных. Для удаления необходимо мышью пометить удаляемые данные, нажатием правой клавиши мышки вызвать контекстное меню и выполнить команду Delete. В рассматриваемом примере необходимо убрать первую колонку с порядковыми номерами и первую строку с идентификаторами переменных. При этом необходимо запомнить размещение данных во вновь полученной таблице:

	Col_1[1]	Col_2	Col_3	Col_4
1	507,20	19,50	359,90	448,10
2	506,60	19,80	187,10	451,90
3	487,80	21,10	375,20	447,90
4	496,00	18,60	287,90	444,30
5	493,60	19,60	444,00	443,20
6	458,90	11,70	462,40	411,70
7	429,30	10,50	459,50	328,60
8	386,90	13,60	511,30	314,70
9	311,50	10,80	328,60	259,40
10	302,20	10,90	350,00	187,70
11	262,00	10,30	298,70	238,50
12	242,20	10,60	529,30	269,40
13	231,90	8,50	320,00	284,00
	214,30	6,70	502,00	172,30
	208,40	8,30	194,90	166,40

В первой колонке содержатся данные зависимой переменной Y, а во второй, третьей и четвертой колонках – соответственно X1, X2 и Х3.

3) Сохранить данные.

Каждой переменной в файле данных Statgraphics Plus будет соответствовать отдельная колонка. Используя меню File/ SAVE/ Save Date File As…, сохраните данный файл с расширением, <имя файла>.sf3 или с расширением .txt.

2. Решение задач в Statgraphics Plus

2.1. Выбор факторных признаков для построения регрессионной модели на основе анализа матрицы коэффициентов корреляции.

Для построения матрицы парной корреляции всех переменных с помощью пакета Statgraphics Plus необходимо выполнить следующие действия:

1) в главном меню выбрать и нажать клавишу Symmary stats. При этом на экране появится диалоговое окно Multiple-Variable Analysis;

заполнить диалоговое окно ввода данных идентификаторами колонок,в которых содержатся данные для анализа. В рассматриваемом примере необходимо ввести: Col_1, Col_2, Col_3. Нажать кнопку OK..
в появившемся подменю Multiple-Variable Analysis выбрать и нажать клавишу Tabular options. В окне табличных настроек поставить флажок напротив Correlations, нажать клавишу OK.. При этом на экране появиться матрица коэффициентов парной корреляции.
Для записи матрицы корреляции в файл с исходными данными вызвать пункт подменюSave results, в окне Correlations.установить флажок и нажать ОК. Файлу будет приписан идентификатор CMAT. Матрица коэффициентов парной корреляции будет продолжением таблицы с исходными данными с колонками CMAT_1, CMAT_2 и т.д. Матрица коэффициентов парной корреляции для рассматриваемого примера имеет вид:

	CMAT_1	CMAT_2	CMAT_3	CMAT_4
1	1,0	0,883818	0,0288061	0,937679
2	0,883818	1,0	0,181598	0,888499
3	0,0288061	0,181598	1,0	0,0333198
4	0,937679	0,888499	0,0333198	1,0

Значения коэффициентов парной корреляции указывают на весьма тесную связь зависимой переменной y с факторными переменными x₁, x₂ и х₃. В то же время межфакторная связь r_x₁_x₂ =0,921 весьма тесная и превышает тесноту связи x₂ с y, что свидетельствует о наличии мультиколлинеарности. В связи с этим для улучшения разрабатываемой модели необходимо исключить из ее структуры фактор x₂ как малоинформативный и недостаточно статистически надежный.

Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух переменных, чем коэффициенты парной корреляции, т.к. очищают парную зависимость от воздействия других переменных.

5) Для отображения на экране результатов вычисления линейных коэффициентов частной корреляции необходимо в окне табличных настроек Tabular options поставить флажок напротив Partial Correlations, а в подменю Save results в окне Partial Correlations установить флажок и нажать ОК. Файлу будет приписан идентификатор PMAT. Матрица коэффициентов частной корреляции будет продолжением матрицы коэффициентов парной корреляции с колонками PMAT_1, PMAT_2, PMAT_3 и PMAT_4. Матрица коэффициентов частной корреляции для рассматриваемого примера имеет вид:

	PMAT_1	PMAT_2	PMAT_3	PMAT_4
1		0,3394	0,125615	0,684299
2	0,3394		-0,351905	0,383612
3	0,125615	-0,351905		0,119295
4	0,684299	0,383612	0,119295

Как следует из полученной матрицы, наиболее тесно связан y с факторами x₁, x₃, коэффициенты частной корреляции равны r_yx_1._x₂=0,712, r_yx_3._x₂=0,737. Связь y с фактором x₂ гораздо слабее и равна r_yx_2._x₁=-0,371. Межфакторная зависимость x₁ и x₂, равная r_x₁_x_2._y=0,855 выше, чем парная y и x₂: r_yx_2._x₁= =-0,371.

Все это приводит к выводу о необходимости исключить фактор x₂ из правой части уравнения множественной регрессии.

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи между анализируемыми переменными.

На основе анализа матрицы коэффициентов парной корреляции делаем вывод о целесообразности построения двухфакторного регрессионного уравнения y=f(x₂ y)

2.2. Построение линейного уравнения регрессии.

По заданию необходимо построить регрессионную модель со значимыми факторами в линейной форме.

Оценку параметров уравнения регрессии необходимо осуществить по методу наименьших квадратов. Для проведения регрессионного анализа с помощью пакета Statgraphics Plus выполнить следующие действия:

В главном меню вызвать программу Multiple regression. Заполнить диалоговое окно ввода данных. В окно Dependent Variable занести имя колонки с результирующей переменной – Col_3 В окно Independent Variables занести имена колонок с отобранными факторными переменными – Col_3 Col_2 Нажать клавишу OK. Результат вычисления функции появиться в отдельном окне Multiple regression Analysis. Для рассматриваемого примера результаты вычислений будут следующими:

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: Col_3

-----------------------------------------------------------------------------

Standard T

Parameter Estimate Error Statistic P-Value

-----------------------------------------------------------------------------

CONSTANT 427,592 85,3512 5,00979 0,0002

Col_2 -4,00536 6,01557 -0,665832 0,5172

-----------------------------------------------------------------------------

Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Model 5448,7 1 5448,7 0,44 0,5172

Residual 159775,0 13 12290,4

-----------------------------------------------------------------------------

Total (Corr.) 165223,0 14

R-squared = 3,29778 percent

R-squared (adjusted for d.f.) = 0,0 percent

Standard Error of Est. = 110,862

Mean absolute error = 90,2232

Durbin-Watson statistic = 2,3116

В первой колонке Parameter перечисляются используемые в модели независимые переменные, а во второй колонке Estimate содержатся коэффициенты уравнения регрессии.

По результатам вычислений составим уравнение множественной регрессии вида:

y = 427,592 - 4,00536* x₂

Значения случайных ошибок параметров уравнения регрессии записаны в колонке Standard Error:

m_b₀=85,3512; m_b₁= 6,01557;

Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения использованы при расчетном определении t- критерия Стьюдента, приведенные в колонке T Statistic:

t_b₀=5,00979 t_b₁=-0,665832

Если расчетное значение критерия больше табличного значения, то можно делать вывод о существенности данного параметра, который формируется под воздействием неслучайных величин x₁ и x₃. В противном случае принимается гипотеза о случайной природе значения коэффициента уравнения, и соответствующая переменная исключается из структуры модели как неинформативный фактор.

Табличное значение t-критерия Стьюдента для уровня значимости α=0,05 и числа степеней свободы f=13 равно t_т=2,16

В рассматриваемом примере расчетные значения t-критерия Стьюдента больше табличного значения t_т=2,16, что подтверждает статистическую значимость параметров b₀ , b₁ .

Величина b₀ оценивает агрегированное влияние неучтенных факторов на результирующую переменную y. Величины b₁ , b₃ указывают, что с увеличением x₁ и x₃ на единицу их значений результирующая переменная увеличиться соответственно на 4,00536. Сравнивать эти значения между собой не следует, т.к. они зависят от единицы измерения каждого признака и поэтому не сопоставимы между собой.

2) Оценить надежность уравнения регрессии в целом и коэффициента детерминации.

Во второй таблице Analysis of Variance приводятся результаты дисперсионного анализа. В первой строке таблицы Model приводится дисперсия регрессии, во второй Residual – дисперсия остатка, а в третьей - Total (Corr.) – общая дисперсия. Колонки слева на право содержат: сумму квадратов – Sum of Squares, число степеней свободы – Df, оценку дисперсии – Mean Square, расчетный критерий Фишера – F-Ratio.

Оценку надежности уравнения регрессии в целом и коэффициента детерминации дает расчетное значение F - критерия Фишера, равное F_р=0,44 . Сравнение расчетного значения критерия с табличным позволяет проверить гипотезу об адекватности модели и значимости коэффициента детерминации. Табличное значение F – критерия Фишера для уровня значимости α=0,05 и числа степеней свободы f₁=1, f₂=13 равно F_т=4,67. Расчетное значение F - критерия Фишера больше табличного значения F_р=0,44 больше F_т=4,74. Значит модель неадекватна.

Уравнение регрессии следует признать неадекватным, модель считается незначимой.

В нижней части таблицы приводятся:

Коэффициент детерминации R-squared в процентах;

R-squared = 3,29778 percent

Нормированный коэффициент R-квадрат R-squared(adjusted for d.f.);

R-squared (adjusted for d.f.) = 0,0 percent

Стандартная ошибка Standard Error of Est.;

Standard Error of Est. = 110,862

Среднее значение абсолютной ошибки Mean absolute error;

Mean absolute error = 90,2232

Статистика Дурбина – Ватсона Durbin-Watson statistic- 2,3116

Коэффициент детерминации R-squared R²= 3,29778 % показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 3,29% вариации зависимой переменной учтено в модели и обусловлено вариацией включенных факторов.

Коэффициент множественной корреляции R=6,01557 показывает тесноту связи зависимой переменной y со всеми включенными в модель объясняющими факторами x₁, x₃.

Скорректированный коэффициент детерминации R-squared(adjusted for d.f.) равен 0,0 %. Он определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсии и позволяет сравнивать модели с разным числом факторов. Оба коэффициента детерминации указывают на высокую детерминированность результатов y факторами x₁ и x₃.

Статистика Дурбина – Ватсона Durbin-Watson statistic=2,3116 используется при проверке коррелированности остатков модели.

2.3. Расчет частных коэффициентов эластичности

1) Для получения статистических оценок по исходным данным и результатам вычислений необходимо вызвать из главного меню Statgraphics Plus программу Summary ststis. При этом на экране появится диалоговое окно Multiple-Variable Analysis. Заполнить диалоговое окно ввода данных идентификаторами колонок, в которых содержатся данные для анализа. В рассматриваемом примере необходимо ввести: Col_2, Col_3. Нажать кнопку OK.

2) В появившемся подменю Multiple-Variable Analysis выбрать и нажать клавишу Tabular options. В окне табличных настроек поставить флажок напротив Summary ststistics, нажать клавишу OK.. При этом на экране появится таблица со статистическими данными переменных, записанных в колонках Col_2, Col_3:

Summary Statistics

Col_2 Col_3

Count 15 15

Average 13,3667 374,053

Variance 24,2595 11801,7

Standard deviation 4,9254 108,635

Minimum 6,7 187,1

Maximum 21,1 529,3

Stnd. skewness 0,756068 -0,36014

Stnd. kurtosis -1,14019 -0,675618

Sum 200,5 5610,8

Строки таблицы в порядке следования сверху вниз содержат следующие статистические данные по каждой переменной: количество наблюдений, среднее значение, дисперсия, стандартное отклонение, минимальное значение, максимальное значение, коэффициент асимметрии, коэффициент крутизны, сумма.

Средние значения Average использовать для расчета коэффициентов эластичности регрессионной модели.

3) Рассчитать частные коэффициенты эластичности по формулам:

где b_i – коэффициент регрессии при x_i в уравнении множественной регрессии;

среднее значение i-го фактора;

- среднее значение результирующей переменной.

Для решаемой задачи получаем:

Э_yx₁=(6,01557∙- 0,4)/ 374 =169,167 ,

По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результирующий признак y фактора x₁. При изменении на 1% факторной переменной x₁ результирующая переменная y измениться на 1,4%.

2.4. Построение прогноза

1) Для построения прогноза вначале необходимо ввести прогнозные значения выбранных факторов x₁=38 и x₃=10 в таблицу с исходными данными:

	Col_1[1]	Col_2	Col_3	Col_4
1	74	33	56	10
2	84	34	58	8
3	73	36	67	7
4	93	35	70	9
5	56	33	73	8
6	71	37	77	7
7	117	39	78	12
8	111	42	99	9
9	135	43	93	13
10	125	44	96	12
11		38		10

2) Рассчитать прогнозируемое значение результирующей переменной (точечный прогноз), для чего в меню программы Multiple regression нажать клавишу Save results.. В окне сохранения результатов Save results Options поставить флажок напротив прогнозное значение - Predicted Values, нажать клавишу OK..В окне табличных данных появится колонка прогноза - Predicted с рассчитанными по регрессионной модели данными:

Predicted

80,1464

72,0052

73,3791

81,5203

68,3756

77,0087

113,695

106,928

134,099

131,843

98,2946

Последняя строка таблицы содержит прогнозное значение результирующей переменной:

3) Определить интервальные значения прогнозируемой переменной для уровня значимости α=0,05.

В окне сохранения результатов Save results Options поставить два флажка напротив нижний предел - Lower Limits for Predictions и верхний предел Upper Limits for Predictions, нажать клавишу OK. В окне табличных данных появятся колонки прогноза - Predicted с интервальными значениями: нижним пределом - Lower Plims и верхним пределом - Upper Plims рассчитанными для уровня значимости α=0,05.

Predicted Lower Plims Upper Plims

80,1464 54,65 105,643

72,0052 48,6046 95,4058

73,3791 49,1401 97,618

81,5203 58,4868 104,554

68,3756 44,4929 92,2583

77,0087 52,3479 101,67

113,695 89,3879 138,002

106,928 81,6375 132,218

134,099 108,674 159,523

131,843 106,727 156,959

98,2946 75,6931 120,896

Для рассматриваемого примера интервальный прогноз находится в нижней строке таблицы:

2.5. Запись результатов вычислений в рабочую папку и завершение работы с программой Statgraphics Plus.

1) Результаты вычислений, отображаемые в окне пакета программ Statgraphics Plus записывать в свою папку в виде отдельных фалов. Для записи содержимого экрана необходимо выполнить следующую последовательность команд:

File\ Save As\ Save StatFollio As…\ далее укажите <имя папки> для записи, тип файла StatFollios \ *.sgp \< имя файла >.

Завершить работу с пакетом программ Statgraphics Plus.

ПОРЯДОК ВЫПОЛНЕНИЯ И ОФОРМЛЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ

В ходе выполнения лабораторной работы требуется:

1. Получить решение задачи с помощью пакета программ

Statgraphics Plus;

2. Составить папку с протоколом решения (экспресс-отчет). Сохранить протокол на диске D в папке Эконометрика с имени файла: прИванов И_И

Протокол решения должен содержать:

Окно вывода Statgraphics Plus с исходными данными, матрицей парных коэффициентов корреляции и прогнозом результирующей переменной (интервальный прогноз).
Результаты решения программы Multiple regression.

При решении приведенных типовых задач регрессионного анализа с помощью программы Statgraphics Plus могут использоваться разнообразные подходы к оформлению результатов решения. В каждой конкретной ситуации студенты могут выбрать свой подход - с позиций содержательности, наглядности, удобства, дизайна.

3. Оформить лабораторную работу в полном объеме. Оформление проводится студентом самостоятельно во время или после занятий в установленные преподавателем сроки. Файл с результатами решения сохраняется на диске D в папке Эконометрика с имени файла: лрИванов И_И

Полный отчет по лабораторной работе должен содержать:

титульный лист (с указанием всех необходимых реквизитов);
постановку экономической задачи;
экономико-математическую модель с необходимыми комментариями по ее элементам;
описание компьютерной информационной технологии получения решения;
предложения (рекомендации) лицу, ответственному за принятие решений, по оптимальному управленческому поведению.

Желательный объем указанного отчета – 3-7 страниц. При отсутствии необходимого объема учебного времени по указанию преподавателя возможен экспресс-отчет (для студентов, посетивших все занятия и самостоятельно выполнивших аудиторную работу в присутствии преподавателя).

К зачету допускаются студенты, выполнившие все пункты задания и оформившие результаты в установленном порядке.

Зачет по лабораторной работе каждый студент сдает персонально преподавателю, ведущему занятия в данной группе.

Для получения зачета студент должен:

- знать теоретические основы тематики лабораторной работы в объеме содержания материалов учебного - методического пособия и лекций;

- уметь ответить на конкретные вопросы по содержанию выполненной лабораторной работы.

Номер Вашего варианта задания будет задан преподавателем во время выполнения лабораторной работы.

Данные к задачам в текстовом формате будут размещены на диске D в папке Эконометрика.

Вариант 10. Установите направление и характер взаимосвязи между четырьмя факторами по 15 банкам зарубежной страны (табл. 10).

Таблица 10

№ пп X1 X2 Х3 X4

1 507,2 19,5 359,9 448,1

2 506,6 19,8 187,1 451,9

3 487,8 21,1 375,2 447,9

4 496 18,6 287,9 444,3

5 493,6 19,6 444 443,2

6 458,9 11,7 462,4 411,7

7 429,3 10,5 459,5 328,6

8 386,9 13,6 511,3 314,7

9 311,5 10,8 328,6 259,4

10 302,2 10,9 350 187,7

11 262 10,3 298,7 238,5

12 242,2 10,6 529,3 269,4

13 231,9 8,5 320 284

14 214,3 6,7 502 172,3

15 208,4 8,3 194,9 166,4

Обозначения:

Х1 - суммарный актив, млрд. дол;

Х2 - объем вложений акционеров, млрд. дол;

Х3 - чистый доход, млрд. дол;

Х4 - депозиты, млрд. дол.

Задание

1. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы мультиколлинеарны.

2. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.

3. Оцените статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.

4. Отберите информативные факторы. Постройте уравнение регрессии со статистически значимыми факторами. Рассчитайте коэффициенты эластичности.

5. Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

6. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (а = 0,05; а = 0,10).

Вариант 11. Имеются данные о посевной площади зерновых культур,

валовом сборе и внесении минеральных удобрений на 1 га посевной площади (табл.11). Обоснуйте выбор результирующего и факторных признаков. Постройте множественное уравнение регрессии, проанализируйте полученные результаты.

	CMAT_1	CMAT_2	CMAT_3	CMAT_4
1	1,0	0,883818	0,0288061	0,937679
2	0,883818	1,0	0,181598	0,888499
3	0,0288061	0,181598	1,0	0,0333198
4	0,937679	0,888499	0,0333198	1,0

	PMAT_1	PMAT_2	PMAT_3	PMAT_4
1		0,3394	0,125615	0,684299
2	0,3394		-0,351905	0,383612
3	0,125615	-0,351905		0,119295
4	0,684299	0,383612	0,119295

Как следует из полученной матрицы, наиболее тесно связан y с факторами x₁, x₃, коэффициенты частной корреляции равны r_x₂_x₂=0,3394 _x_3._x₂=0,737. Связь y с фактором x₂ гораздо слабее и равна r_yx_2._x₁=-0,371. Межфакторная зависимость x₁ и x₂, равная r_x₁_x_2._y=0,855 выше, чем парная y и x₂: r_yx_2._x₁= =-0,371.

На основе анализа матрицы коэффициентов парной корреляции делаем вывод о целесообразности построения двухфакторного регрессионного уравнения y=f(x₁, x₃).

Внимание!

Если вам нужна помощь в написании работы, то рекомендуем обратиться к профессионалам. Более 70 000 авторов готовы помочь вам прямо сейчас. Бесплатные корректировки и доработки. Узнайте стоимость своей работы

Бесплатная оценка

Размер: 32.68K

Скачано: 334

Скачать бесплатно

05.05.11 в 12:08 Автор:

Понравилось? Нажмите на кнопочку ниже. Вам не сложно, а нам приятно).

Чтобы скачать бесплатно Лабораторные работы на максимальной скорости, зарегистрируйтесь или авторизуйтесь на сайте.

Важно! Все представленные Лабораторные работы для бесплатного скачивания предназначены для составления плана или основы собственных научных трудов.

Друзья! У вас есть уникальная возможность помочь таким же студентам как и вы! Если наш сайт помог вам найти нужную работу, то вы, безусловно, понимаете как добавленная вами работа может облегчить труд другим.

Добавить работу

Если Лабораторная работа, по Вашему мнению, плохого качества, или эту работу Вы уже встречали, сообщите об этом нам.

Добавление отзыва к работе

Добавить отзыв могут только зарегистрированные пользователи.