Область прогноза для однофакторной и двухфакторной модели. Точечный прогноз на основании линейной прогрессии

Доступен только на StudyGur

Тема:
Скачиваний: 0
Страниц: 19
Опубликован:
ЧИТАЙТЕ ПОЛНЫЙ ТЕКСТ ДОКУМЕНТА

ПРЕДПРОСМОТР

Министерство образования и науки Украины
Донбасская государственная машиностроительная академия
Контрольная работа
по дисциплине: «Эконометрика»
Выполнил:
студент гр. ПВ 09-1з
Измайлов А.О.
Проверила:
Гетьман И.
Краматорск 2010
1. Теоретический вопрос
Область прогноза для однофакторной и двухфакторной модели.
Точечный прогноз на основании линейной прогрессии.
Область прогнозов находится так: среди выборочных х находят x min и
xmax. Отрезок прямой, заключенный между ними называется областью
прогнозов.
Область прогноза
xmin
xmax
Прогнозируемый доверительный интервал для любого х такой
 y  , y   .
Совокупность доверительных интервалов для всех х из области
прогнозов образует доверительную область, которая представляет область
заключения между двумя гиперболами. Наиболее узкое место в точке x .
y=b0+b1x
y
xmin
x
xmax
Прогноз для произвольного х дает интервал, в который с вероятностью
 попадает неизвестное

y
yx
с гарантией   100% .

. Т.е. прогноз при заданном х составит от y   до
Максимальная ошибка прогноза.
Выборочные
значения
yi
равны
yi  0  1 xi   i ,
где
 0 ,1
коэффициенты регрессии для всей генеральной совокупности,  i - случайная
величина, значение которой мы определить не можем, так как не знаем 0 ,1 .
Для
неизвестных
коэффициентов
 0 ,1
могут
быть
найдены
доверительные интервалы, в которые с надежностью  попадают 0 ,1 :
b1  b1 , b1  b1 , b0  b0 , b0  b0 .
Геометрический смысл коэффициента  0 - ордината пересечения
прямой регрессии с осью 0Y, коэффициента 1 - угловой коэффициент
прямой регрессии. Вследствие этого возникает следующая ситуация:
y
tg=b1-1
b0-0

y=b0+b1x
y
y
yпр
b0
b0+0

tg=b1+1
tg=b1+1
x
xпр
Истинная прямая регрессии может с вероятностью  занимать любое
положение в доверительной области.

Наиболее максимальное отклонение от расчетного значения - y   или

y   . Найдем ошибку прогноза для
каждого из значений:




y y
y y


 100%    100%
 100%    100%


y
y
y
y
,
.

  100%
y
Т.е. максимальная ошибка прогноза в процентах составляет:
,
т.е. чем больше полуширина доверительного интервала, тем больше ошибка.
Ширина доверительного интервала возрастает с ростом коэффициента
1
доверия и уменьшается с ростом объема выборки со скоростью
n . Т.е.
увеличив объем выборки в 4 раза, в 2 раза сузим доверительный интервал,
т.е. в 2 раза уменьшим ошибку прогноза. С уменьшением коэффициента
доверия уменьшается ошибка прогноза, но растет вероятность того, что
истинное значение не попадет в доверительный интервал.
Прогноз на основании линейной модели для двуфакторной модели.
Целью регрессионного анализа является получение прогноза с
доверительным интервалом. Прогноз делается по уравнению регрессии

Y  b0  b1 X1    b p X p
x1
Точка прогноза
x2  x p

двухфакторная

x
(1)
из p-мерного пространства с координатами
выбирается из области прогноза. Если, например, модель

Y  b0  b1 X 1  b2 X 2
,
то
область
прямоугольником, представленным на рис. 1.
x2max
x2min
x1min
Рис. 1
x1max
прогноза
определяется
Т.е. область прогноза определяется системой неравенств:
 x1min  x1  x1max

 x2 min  x2  x2 max


x
 p min  x p  x p max
Чтобы
получить
формулу
для
вычисления
полуширины

доверительного интервала, нужно перейти к матричной форме записи
уравнения регрессии.
Матричная запись многофакторной регрессии
Данные для построения уравнения регрессии, сведем в таблицу:
Таблица 1
№ набл
Y
X1
X2
…
1
y1
x11
x12
x1p
2
y2
x21
x22
x2p
Xp
…
n
yn
xn1

Y  b0  b1 X1    b p X p
xn2
xnp
(2)
Подставляя в уравнение (2) значения из каждой строки таблицы,
получим n уравнений.
 y1  b0  b1 x11  b2 x12    b p x1 p  e1

 y 2  b0  b1 x21  b2 x22    b p x2 p  e2


y  b  b x  b x  b x  e
0
1 n1
2 n2
p np
n
 n
(2)
ei – случайные отклонения (остатки), наличие которых объясняется
тем, что выборочные точки не ложатся в точности на плоскость (1), а
случайным образом разбросаны вокруг нее.


ei  yi  yi  yi  b0  b1xi1    b p xip

Чтобы записать систему (2) в матричном виде, вводим матрицу X,
составленную из множителей при коэффициентах b1, b2, …, bp.
 1 x11

 1 x21
X

 1 xn1

Матрица
x1 p 

x22  x2 p 



xn 2  xnp 
. Размерность матрицы np+1.

x12
Еще вводятся матрицы:
 y1 
 b1 
 e1 
 
 
 
  y 2    b2 
e 
Y   B  E  2



 
 
 
y 
b 
e 
 n ,
 n ,
 n  , размерностью n1.
Вектор столбец
Тогда в матричной форме уравнение регрессии записывается так:

 
Y  XB  E .
Полуширина доверительного интервала рассчитывается по формуле:



1 
  et  1  X т  X т  X  X
,
где  e - среднее квадратическое отклонение остатков;
t
- критическая точка распределения Стьюдента, соответствующая
уровню доверия =(0.95, 0.99, 0.999) и степени свободы k=n-p-1.
 1 
 
  x1 
X  

 
xp 
  точка из области прогноза.
вектор
2. Задача
Найдите коэффициент эластичности для указанной модели в заданной
точке x. Сделать экономический вывод.
y
1
1
x
X=1
Найдем производную функции
1.
x
E x  y x
y
y
1
1
 1 y'   2
x ,
x
Ex 
, тогда
x  1 
1
 2   
1
1 x
1  x 
x
2.
Найдем эластичность.
3.
Коэффициент эластичности для точки прогноза:
X=1
Ex  
1
 0,5
11
Коэффициент эластичности показывает, что при изменении фактора X
=1 на 1% показатель Y уменьшится на 0,5%.
3. Задача
Для представленных данных выполнить следующее задание:
1.
Провести
эконометрический
анализ
линейной
зависимости
показателя от первого фактора. Сделать прогноз для любой точки из области
прогноза,
построить
доверительную
область.
Найти
коэффициент
эластичности в точке прогноза.
2. Провести эконометрический анализ нелинейной зависимости
показателя от второго фактора, воспользовавшись подсказкой. Сделать
прогноз для любой точки из области прогноза, построить доверительную
область. Найти коэффициент эластичности в точке прогноза.
3.
Провести
эконометрический
анализ
линейной
зависимости
показателя от двух факторов. Сделать точечный прогноз для любой точки из
области прогноза. Найти частичные коэффициенты эластичности в точке
прогноза.
Производительность труда, фондоотдача и уровень рентабельности по
плодоовощным консервным заводам области за год характеризуются
следующими данными:
Фактор
Уровень
Удельный вес пашни
№ района
в
Удельный вес лугов и
продукции
сельскохозяйственн
пастбищ %
%
ых угодьях %
1
80
20
20
2
87,2
12,8
37,5
3
90,8
9,2
43,4
4
94,7
11,3
45,6
5
81,4
18,6
23,4
6
79,2
10,8
25
7
71,3
28,7
17,2
8
86,2
13,8
33,3
9
71,4
28,6
15
10
77,7
22,9
18,7
11
75,4
14
24,8
12
77,9
13
34,5
13
87,2
12,8
33,1
14
68,1
25
19,2
15
86,2
13,8
31,8
убыточности
животноводства
a
b
x
y
Нелинейную зависимость принять
Обозначим вес пашни в с/х % – Х, уровень убыточности (%) – У.
Построим линейную зависимость показателя от фактора. Найдем основные
числовые характеристики. Объем выборки n=15 – суммарное количество
наблюдений. Минимальное значение Х=68,1, максимальное значение Х=94,7,
значит, удельный вес пашни меняется от 68,1 до 94,7 %. Минимальное
значение У=15, максимальное значение У=46,5, уровень убыточности
x
животноводства от 15 до 46,5%. Среднее значение
1
n
n
 xi
i 1
. Среднее
значение пашни составляет 80,1%, среднее значение уровня убыточности
составляет 28,2%. Дисперсия
D( X ) 
1
n 1
 ( xi  x) 2 = 58,83,
92,965. Среднеквадратическое отклонение
x 
D(Y ) 
1
n 1
 ( yi  y ) 2 =
7,67, значит среднее
отклонение пашни от среднего значения, составляет 7,67%.,
y 
9,64, значит
среднее отклонение уровня убыточности от среднего значения, составляет
9,64%. Определим, связаны ли Х и У между собой, и, если да, то определить
формулу связи. По таблице строим корреляционное поле (диаграмму
рассеивания) – нанесем точки xi , y i  на график. Точка с координатами
x, y  =(80; 27,08) называется центром рассеяния. По виду корреляционного
поля можно предположить, что зависимость между y и x линейная. Для
определения тесноты линейной связи найдем коэффициент корреляции:
1
n
rxy 
n
 xi  x  yi  y 
i 1
 x y
=0,88 Так как
0.6  rxy  0.9
то линейная связь между Х и У
достаточная. Пытаемся описать связь между х и у зависимостью
Параметры b0, b1 находим по МНК.
b1  rxy
y  b0  b1x
.
y
 1.1085; b0  y  b1 x  -61.606
x
Так
как b1>0, то зависимость между х и y прямая: с ростом пашни уровень
убыточности
животноводства
возрастает.
Проверим
значимость
коэффициентов bi. Значимость коэффициента b может быть проверена с
помощью критерия Стьюдента:
t набл 
b0

 b0
-4,608. Значимость
t набл
равна 0,000490101, т.е практически
0%. Коэффициент b0 статистически не значим.
t набл 
b1

 b1
6,744. Значимость
t набл
равна 1,375·10-5, т.е 0%, что меньше,
чем 5%. Коэффициент b1 статистически значим. Получили модель
зависимости
уровня
пашни
от
убыточности
животноводства
y  1.1085 x  61.606
После того, как была построена модель, необходимо проверить ее на
адекватность.
Для анализа общего качества оцененной линейной регрессии найдем
коэффициент детерминации:
R2 
SSR
SSY
=0,777. Разброс данных объясняется
линейной моделью на 77,7% и на 22,3% – случайными ошибками. Качество
модели плохое.
Проверим с помощью критерия Фишера.
Для
MSE 
проверки
SSE

k 2 1012,166.
критерия Фишера
т.е.
процент
Найдем
величины:
SSR

k1 1012,166
и
Вычисляем k1=1, k2=13. Находим наблюдаемое значение
Fнабл 
ошибки
y  1.1085 x  61.606
найдем
MSR 
MSR

MSE 45.48.
равен
Значимось этого значения =1,37610-5,
0%,
что
меньше,
чем
5%.
Модель
считается адекватной с гарантией более 95%.
прогноз
на
основании
линейной
регрессии.
Выберем
произвольную точку из области прогноза x  [69.1;94.7] , х=80
Рассчитываем прогнозные значения по модели для всех точек выборки
и для точки прогноза: y( x  80)  1.1085  80  61.606  27.08
Найдем полуширину доверительного интервала в каждой точке
  e  t y  1 
выборки xпр:
( xпр  x)2
1

n
( xi  x)2
i

е – средне квадратичное отклонение выборочных точек от линии
регрессии
 e  MSE 
4,72
ty = критическая точка распределения Стьюдента для надежности =0,9
и k2=13.
n =15.
n
SX 
 xi  x 2
i 1
или SX  n 1 D( X )  823.604
xпр – точка из области прогнозов.
Прогнозируемый доверительный интервал для любого х такой
 y  , y   , где (х=80)=10,53, т.е. доверительный интервал для хпр=80
составит от 16,55 до 37,61 с гарантией 90%.
Совокупность доверительных интервалов для всех х из области
прогнозов образует доверительную область.
Т.е. при пашни 80 % уровень убытка животноводства составит от 16%
до 37,5%.
Найдем эластичность.
Для линейной модели
E x 5000 
Ex 
 1.1085 x
 1.1085 x  61.606
 1.1085  80
 3.29
 1.1085  80  61.606
Коэффициент эластичности показывает, что при изменении х=80 на 1%
показатель y увеличивается на 3,29%.
Обозначим пашни в с/х – Х, уровень убыточности – У. Построим
y
нелинейную зависимость показателя от фактора вида
a
b
x
.
Найдем
основные числовые характеристики. Объем выборки n=15 – суммарное
количество наблюдений.
Минимальное значение Х=9.2, максимальное значение Х=28.7, значит,
площадь пашен изменяется от 9.2 до 28.7%. Минимальное значение У=15,
максимальное значение У=45.6, уровень убыточности животноводства
x
изменяется от 15 до 45.6%. Среднее значение
пашни
составляет
17.02%,
среднее
1
n
значение
n
 xi
i 1
. Среднее значение
уровня
убыточности
животноводства составляет 28.17%.
Дисперсия
D( X ) 
1
n 1
 ( xi  x) 2 =42.45, D(Y )  n 1 1 ( yi  y)2 =92.965.
Среднеквадратическое отклонение
 x  6.52,
значит среднее отклонение
объема пашни от среднего значения, составляет 6.52%,
y 
9.64, значит
среднее отклонение уровня убыточности животноводства от среднего
значения, составляет 9.64%.
Определим, связаны ли Х и У между собой, и, если да, то определить
формулу связи. По таблице строим корреляционное поле (диаграмму
рассеивания) – нанесем точки xi , yi  на график.
Точка с координатами
x, y  =(17.02; 28.17) называется центром
рассеяния.
По виду корреляционного поля можно предположить, что зависимость
между y и x нелинейная.
Пытаемся описать связь между х и у зависимостью
y
a
b
x
. Перейдем
к линейной модели. Делаем линеаризующую подстановку:
Vy
,
U
1
x.
Получили новые данные U и V. Для этих данных строим линейную модель:
v  b0  b1u
Проверим тесноту линейной связи u и v. Найдем коэффициент
корреляции:
ruv  0,864.
Между u и v сильная линейная связь.
Параметры b0, b1 находим по МНК.
b1  ruv
v
 370.76; b0  v  b1u  3.54
u
Проверим значимость коэффициентов bi. Значимость коэффициента b
может быть проверена с помощью критерия Стьюдента:
t набл 
b0
 b0
=0.845. Значимость
t набл
равна 0,413, т.е практически 41%.
Коэффициент b0 статистически не значим.
t набл 
b1

 b1
6.19 Значимость
равна 0,000032, т.е практически 0%.
t набл
Коэффициент b1 статистически значим.
Получили линейную модель V  0.845u  6.19
После того, как была построена модель, необходимо проверить ее на
адекватность.
Для анализа общего качества оцененной линейной регрессии найдем
коэффициент детерминации:
R2 
SSR
SSY
=0,747. Разброс данных объясняется
линейной моделью на 75% и на 25% – случайными ошибками. Качество
модели хорошее.
Проверим с помощью критерия Фишера.
Для проверки находим величины:
MSR 
SSR

k1
972.42 и
MSE 
SSE

k 2 25.32.
Вычисляем k1=1, k2=13. Находим наблюдаемое значение критерия Фишера
Fнабл 
MSR

MSE 38.41.
Значимось этого значения =0,000032, т.е. процент ошибки
практически равен 0%. Модель V  0.845u  6.19 считается адекватной с
гарантией более 99%.
Так как линейная модель адекватна, то и соответствующая нелинейная
модель тоже адекватна.
Находим параметры исходной нелинейной модели: а=b1=370.76; b=
b0=3.53.
Вид нелинейной функции:
y
370.76
 3.53
x
.
Т.е. зависимость уровня убыточности от площади пашен имеет вид:
y
370.76
 3.53
x
.
Найдем прогноз на основании модели. Выберем произвольную точку
из области прогноза [9.2; 28.7], х=15
Рассчитываем прогнозные значения по модели для всех точек выборки
и для точки прогноза:
y  x  15 
370.76
 3.53 
15
28.25
Найдем полуширину доверительного интервала в каждой точке
выборки. Для этого найдем полуширину для линейной модели:
  e  t y  1 
(uпр  u )2
1

n
(ui  u )2
i

е – средне квадратичное отклонение выборочных точек от линии
регрессии
 e  MSE 
5.03
SU  n 1 D(U )  14  0,0005  0,007
uпр – точка из области прогнозов. Прогнозируемый доверительный


интервал для любого u такой v  , v  
Для
нелинейной
модели
найдем
воспользовавшись обратной заменой:
доверительный
y min  v min, y max  v max
интервал,
Совокупность
доверительных интервалов для всех х из области прогнозов образует
доверительную область.
Прогноз для х=15 составит от 17.03 до 39.48 с гарантией 90%.
Т.е. при площади пашен 15 уровень убыточности животноводства
составит от 17.03% до 39.48%.
Найдем эластичность.
Коэффициент эластичности для точки прогноза:
Ex 
x
y x
y
,

370.76
 370.76

yx  
 3.53   
x2
 x

Ex 
x
370.76
 370.76 


2
370.76
3.53  370.76 x
x

 3.53 
x
Коэффициент эластичности для точки прогноза:
E x 15  
370.76
 13.12
3.53  370.76 15
Коэффициент эластичности показывает, что при изменении площади
паши 15 % на 1% уровень убыточности животноводства увеличивается на
13.12%.
Обозначим удельный вес пашни – Х1 %, удельный вес лугов и пастбищ
- Х2 %, уровень убыточности продукции животноводства - У %. Построим
линейную зависимость показателя от факторов. Найдем основные числовые
характеристики. Объем выборки n=15 – суммарное количество наблюдений.
Минимальное значение Х1=68.1, максимальное значение Х1=94.7, значит,
удельный вес пашни изменяется от 68.1 до 94.7%. Минимальное значение
Х2=9.2, максимальное значение Х2=28.7, значит, вес лугов и пастбищ
изменяется от 9.2 до 28.7%. Минимальное значение У=15, максимальное
значение У=45.6, уровень убыточности животноводства изменяется от 15 до
45.6%. Среднее значение
1
x
n
n
 xi
i 1
.
Среднее значение веса пашни составляет 80.98 %, среднее значение
веса лугов и пастбищ составляет 17.02, среднее значение уровня
убыточности животноводства составляет 28.17%.
D( X 1) 
Дисперсия
D(Y ) 
1
n 1
1
n 1
 ( x1i  x1) 2 =58,83,
D ( X 2) 
1
n 1
 ( x2i  x2) 2 =42,45
( yi  y)2 =92.96%.
Среднеквадратическое
отклонение
веса
 x1 
отклонение
пашни
от
среднего
значения,
 x2  6.52,
среднеквадратическое отклонение
значит
среднее
составляет
7.67%.,
7.67,
значит среднее отклонение
удельного веса лугов и пастбищ от среднего значения, составляет
6.52%,  y  9.65,
значит
среднее
отклонение
уровня
убыточного
животноводства от среднего значения, составляет 9.65%.
Прежде чем строить модель, проверим факторы на коллинеарность. По
исходным
данным
строим
корреляционную
корреляции между X1 и X2 равен 0,89. Так как
матрицу.
rx1x2  0.9
,
Коэффициент
значит X1 и X2 –
неколлинеарные
Определим, связаны ли Х1, Х2 и У между собой.
Для определения тесноты линейной связи найдем коэффициент
корреляции: r=0,892. Так как
0.6  rxy  0.9
то линейная связь между Х1, Х2 и У
достаточная.
Пытаемся описать связь между х и у зависимостью
Параметры b0, b1, b2 находим по МНК.
y  b0  b1 x1  b2 x2 .
b2  0.586 b1  0,718; b0  -19.995
.
Проверим значимость коэффициентов bi.
Значимость коэффициента b может быть проверена с помощью
критерия Стьюдента:
t набл 
b0

 b0
-0,867. Значимость
t набл
равна 0.402, т.е приблизительно
40%. Так как это значение намного больше 5%, то коэффициент b0
статистически не значим.
t набл 
b1

 b1
3.04. Значимость
t набл
равна 0.0102, т.е 1%. Так как это
значение меньше 5%, то коэффициент b1 статистически значим.
t набл 
b2

 b2
-2.107. Значимость
t набл
равна 0.056, т.е 5%. Так как это
значение больше 5%, то коэффициент b2 статистически не значим.
Проверим адекватность.
Для анализа общего качества оцененной линейной регрессии найдем
коэффициент детерминации:
R2 
SSR
SSY
=0,8377. Разброс данных объясняется
линейной моделью на 84% и на 16% – случайными ошибками. Качество
модели хорошее.
Проверим с помощью критерия Фишера.
Для проверки найдем величины:
MSR 
SSR

k1 545.17
и
MSE 
SSE

k2
17.6.
Вычисляем k1=2, k2=12. Находим наблюдаемое значение критерия Фишера
Fнабл 
MSR

MSE 30.98
Значимость этого значения =0.000018, т.е. процент
ошибки равен 0,00018%. Так как это значение меньше 5%, то модель
y  19.995  0.718 x1  0.586 x 2
считается адекватной с гарантией более 99%.
Получили модель зависимости уровня удельного веса пашни от
удельного
веса
лугов
и
пастбищ
и
убыточности
скотоводства
y  0.2306  0.00416 x1  0.0398 x 2
Найдем
прогноз
на
основании
линейной
регрессии.
68.1  x1  94.7

произвольную точку из области прогноза: 9.2  x 2  28.7
Выберем
х1=80, х2=30.
Рассчитываем прогнозные значения по модели для всех точек выборки и для
точки прогноза: y  0.2306  0.00416  80  0.0398  30  19.86
Т.е. при удельном весе пашен 80% и весе лугов и пастбищ 30% уровень
убыточности животноводства составит 19.86%.
Найдем эластичность по каждому фактору.
Для линейной модели
Ex1 
0.00416 x1
0.2306  0.00416 x1  0.0398 x 2 ,
E x180, x 230 
0.00416  30
 2.89
0.2306  0.00416  80  0.0398  30
.
Коэффициент эластичности показывает, что увеличении пашен с 80 %
на 1% и при уровне лугов 30 %, уровень убыточности увеличится с 19.86 грн
на 2.89%.
Для линейной модели
Ex2 
- 0,03981x 2
0.2306  0.00416 x1  0,03981x 2 ,
E x180, x 230 
- 0,03981 30
 0,885
60,245  0,0007  80  0,03981 30
.
Коэффициент эластичности показывает, что увеличении пашен с 80 %
на 1% и при уровне лугов 30 %, уровень убыточности уменьшиться с 19.86
грн на 0.89%.
Для
уменьшения
убыточности
животноводства
целесообразней
увеличивать вес лугов и пастбищ при неизменном весе пашен.
Использованная литература
1. Экономико-математические методы и прикладные модели: Учебное
пособие для вузов / В.В. Федосеев, А.Н. Гармаш и др. - М.: ЮНИТИ, 1999. 391 с.
2. Орлова И.В. Экономико-математические методы и модели. Выполнение
расчетов в среде EXCEL. Практикум: Учебное пособие для вузов. - М.:
Финстатинформ, 2000.- 136 с.
3. Компьютерные технологии экономико-математического моделирования:
Учебное пособие для вузов / Д.М. Дайитбегов, И.В. Орлова. - М.: ЮНИТИ,
2001.
4. Эконометрика: Учебник / Под ред. И.И. Елисеевой. - М.: Финансы и
статистика, 2001.
5. Практикум по эконометрике: Учебное пособие / Под ред. И.И. Елисеевой М.: Финансы и статистика, 2001.
ЗАРЕГИСТРИРУЙТЕСЬ - ЭТО БЕСПЛАТНО

Похожие документы