[Нижегородский государственный педагогический университет
Учебные материалы >> Факультет метематики, информатики и физики]
Лабораторная работа № 2
Тема: «Вариационный ряд.
Числовые характеристики вариационного ряда. Статистические методы изучения зависимостей между случайными величинами.»
Контрольные вопросы и задания.
1. Приведите определение математического ожидания дискретной (абсолютно непрерывной) случайной величины.
Примерный ответ: Математическим ожиданием дискретной случайной величины ξ называют сумму произведений всех ее возможных значений на их вероятности:
2. Является ли выборочное среднее несмещенной (состоятельной) оценкой математического ожидания?
Примерный ответ: Является.
Выборочное среднее в роли случайной величины
,
где n - объём выборки,
является несмещённой и состоятельной оценкой математического ожидания.
По выборочным данным x1, x2,…, xn находим значение выборочного среднего
.
3. Приведите определение дисперсии и среднего квадратического отклонения случайной величины.
Примерный ответ: Дисперсией случайной величины ξ называют математическое ожидание квадрата отклонения случайной величины от её математического ожидания:
D(ξ) = M[ξ - M(ξ)]2.
Дисперсию удобно вычислять по формуле:
D(ξ)=M(ξ 2) - [М(ξ)]2.
Средним квадратическим отклонением случайной величины называют квадратный корень из дисперсии:
.
4. Приведите определения следующих статистических оценок дисперсии: выборочная дисперсия и исправленная выборочная дисперсия. Укажите их свойства.
Примерный ответ: Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их значений Xв:
.
Если значения признака x1, …, xn имеют соответственно частоты n1, …, nk, причём n1+…+nk=n, то выборочную дисперсию можно найти по формуле:
,
т.е. выборочная дисперсия есть среднее взвешенное квадратов отклонений с весами, равными соответствующим частотам.
Теорема. Выборочная дисперсия Dв равна среднему квадратов значений признака минус квадрат общей средней:
.
Выборочная дисперсия в роли случайной величины
является смещённой оценкой дисперсии:
Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии D(ξ). Достаточно для этого умножить на дробь n/(n-1). Сделав это, получим исправленную выборочную дисперсию:
.
Исправленная дисперсия является несмещённой оценкой генеральной дисперсии:
Итак, в качестве несмещённой оценки генеральной дисперсии принимают исправленную дисперсию:
.
По выборочным данным x1, x2,…, xn найдём одно из возможных значений
несмещённой дисперсии s2 . Полученное значение обычно обозначается тем же символом s2 и так же называется выборочной дисперсией.
5. Как найти коэффициент вариации вариационного ряда?
Примерный ответ: Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:
V=(σв/xв)*100%.
6. Приведите определение коэффициента корреляции случайных величин ξ и η.
7. Как найти ковариацию ?
8. В каком случае случайные величины ξ и η называются: а) некоррелированными; б) независимыми?
9. Следует ли из независимости (некоррелированности) случайных величин ξ и η некоррелированность (независимость) этих случайных величин?
10. Приведите определение выборочной ковариации и выборочного коэффициента корреляции случайных величин ξ и η. Как по выборочным данным (x1,y1), (x2,y2), …, (xn,yn) вычислить значения и оценок ?
11. Приведите определение теоретической регрессии η на ξ. Укажите выборочное уравнение прямой линии регрессии η на ξ.
12. Как проводится проверка гипотезы о значимости выборочного коэффициента корреляции?
Задание.
Вариант №1
Соберите данные о значениях признака ξ1 (рост) и признака ξ2 (вес) у студенток группы.
Вариант №2
Соберите данные о значениях признака ξ3 (успеваемость по дисциплине «Дифференциальные уравнения и уравнения с частными производными») и признака ξ4 (успеваемость по дисциплине «Геометрия») у студентов группы.
Вариант №3
Соберите данные о значениях признака ξ3 (успеваемость по дисциплине «Дифференциальные уравнения и уравнения с частными производными») и признака ξ5 (успеваемость по дисциплине «История образования и педагогической мысли») у студентов группы.
Вариант №4
Соберите данные о значениях признака ξ1 (рост) и признака ξ3 (успеваемость по дисциплине «Дифференциальные уравнения и уравнения с частными производными») у студенток группы.
Вариант №5
Соберите данные о значениях признака ξ2 (вес) и признака ξ6 (успеваемость по дисциплине «Теория чисел») у студенток группы.
Цель работы:
1. Овладение различными способами отбора статистических данных.
2. Нахождение точечных характеристик вариационного ряда.
3. Овладение методами установления связи между двумя случайными величинами, проверки статистической гипотезы о значимости выборочного коэффициента корреляции, построения выборочного уравнения прямой линии регрессии.
4. Приобретение навыка работы со статистическими прикладными программами на ЭВМ.
Ход работы:
1). Исходная выборка по росту и весу:
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
Рост |
160 |
168 |
175 |
169 |
170 |
169 |
162 |
166 |
163 |
160 |
158 |
173 |
162 |
173 |
156 |
158 |
168 |
170 |
162 |
155 |
Вес |
48 |
58 |
69 |
64 |
69 |
70 |
51 |
60 |
67 |
54 |
48 |
58 |
44 |
50 |
56 |
56 |
51 |
50 |
60 |
50 |
2). Определение объема выборки:
n=20, где n – объем выборки
3). Составление ранжированного ряда:
Рост |
155 |
156 |
158 |
158 |
160 |
160 |
162 |
162 |
162 |
163 |
166 |
168 |
168 |
169 |
169 |
170 |
170 |
173 |
173 |
175 |
Вес |
44 |
48 |
48 |
50 |
50 |
50 |
51 |
51 |
54 |
56 |
56 |
58 |
58 |
60 |
60 |
64 |
67 |
69 |
69 |
70 |
4). Составление вариационного ряда:
Рост |
155 |
156 |
158 |
160 |
162 |
163 |
166 |
168 |
169 |
170 |
173 |
175 |
Вес |
44 |
48 |
50 |
51 |
54 |
56 |
58 |
60 |
64 |
67 |
69 |
70 |
5). Составление таблицы с указанием статистического распределения частот и относительных частот признака РОСТ:
i |
xi (ξ1) |
ni |
xini |
xi2ni |
ωi |
1 |
155 |
1 |
155 |
24025 |
0,05 |
2 |
156 |
1 |
156 |
24336 |
0,05 |
3 |
158 |
2 |
316 |
49928 |
0,1 |
4 |
160 |
2 |
320 |
51200 |
0,1 |
5 |
162 |
3 |
486 |
78732 |
0,15 |
6 |
163 |
1 |
163 |
26569 |
0,05 |
7 |
166 |
1 |
166 |
27556 |
0,05 |
8 |
168 |
2 |
336 |
56448 |
0,1 |
9 |
169 |
2 |
338 |
57122 |
0,1 |
10 |
170 |
2 |
340 |
57800 |
0,1 |
11 |
173 |
2 |
346 |
59858 |
0,1 |
12 |
175 |
1 |
175 |
30625 |
0,05 |
ИТОГО: |
Σni = 20 |
Σnixi=3297 |
Σnixi2=544199 |
Σ ωi = 1 |
Проверка выполнения равенства n1+…+nk=n и ω1+…+ωk=1
1+1+2+2+3+1+1+2+2+2+2+1=20 (равенство выполняется)
0,05+0,05+0,1+0,1+0,15+0,05+0,05+0,1+0,1+0,1+0,1+0,05=1 (равенство выполняется)
5.1). Полигон абсолютных частот:
5.2). Полигон относительных частот:
6). Составление таблицы с указанием статистического распределения частот и относительных частот признака ВЕС:
i |
yi |
ni |
yini |
yi2ni |
ωi |
1 |
44 |
1 |
44 |
1936 |
0,05 |
2 |
48 |
2 |
96 |
4608 |
0,1 |
3 |
50 |
3 |
150 |
7500 |
0,15 |
4 |
51 |
2 |
102 |
5202 |
0,1 |
5 |
54 |
1 |
54 |
2916 |
0,05 |
6 |
56 |
2 |
112 |
6272 |
0,1 |
7 |
58 |
2 |
116 |
6728 |
0,1 |
8 |
60 |
2 |
120 |
7200 |
0,1 |
9 |
64 |
1 |
64 |
4096 |
0,05 |
10 |
67 |
1 |
67 |
4489 |
0,05 |
11 |
69 |
2 |
138 |
9522 |
0,1 |
12 |
70 |
1 |
70 |
4900 |
0,05 |
ИТОГО: |
Σ ni = 20 |
Σ yini=1133 |
Σyi2ni=65369 |
Σ ωi = 1 |
Проверка выполнения равенства n1+…+nk=n и ω1+…+ωk=1
1+2+3+2+1+2+2+2+1+1+2+1=20 (равенство выполняется)
0,05+0,1+0,15+0,1+0,05+0,1+0,1+0,1+0,05+0,05+0,1+0,05=1 (равенство выполняется)
6.1). Полигон абсолютных частот:
6.2). Полигон относительных частот:
7). Составление эмпирической функции распределения вероятностей по признаку РОСТ и построение её графика:
где nx – накопленная частота, n - объём выборки.
n=20
При x≤155 |
nx=0, F*(x)=0; |
При 166<x≤168 |
nx=11, F*(x)=0,55; |
При 155<x≤156 |
nx=1, F*(x)=0,05; |
При 168<x≤169 |
nx=13, F*(x)=0,65; |
При 156<x≤158 |
nx=2, F*(x)=0,1; |
При 169<x≤170 |
nx=15, F*(x)=0,75; |
При 158<x≤160 |
nx=4, F*(x)=0,2; |
При 170<x≤173 |
nx=17, F*(x)=0,85; |
При 160<x≤162 |
nx=6, F*(x)=0,3; |
При 173<x≤175 |
nx=19, F*(x)=0,95; |
При 162<x≤163 |
nx=9, F*(x)=0,45; |
При x>175 |
nx=20, F*(x)=1; |
При 163<x≤166 |
nx=10, F*(x)=0,5; |
|
|
Получили функцию:
0 |
x≤155 |
0,05 |
155<x≤156 |
0,1 |
156<x≤158 |
0,2 |
158<x≤160 |
0,3 |
160<x≤162 |
0,45 |
162<x≤163 |
0,5 |
163<x≤166 |
0,55 |
166<x≤168 |
0,65 |
168<x≤169 |
0,75 |
169<x≤170 |
0,85 |
170<x≤173 |
0,95 |
173<x≤175 |
1 |
x>175 |
График функции F*(x):
8). Составление эмпирической функции распределения вероятностей по признаку ВЕС и построение её графика:
где ny – накопленная частота, n - объём выборки.
n=20
При y≤44 |
ny=0, F*(y)=0; |
При 58<y≤60 |
ny=13, F*(y)=0,65; |
При 44<y≤48 |
ny=1, F*(y)=0,05; |
При 60<y≤64 |
ny=15, F*(y)=0,75; |
При 48<y≤50 |
ny=3, F*(y)=0,15; |
При 64<y≤67 |
ny=16, F*(y)=0,8; |
При 50<y≤51 |
ny=6, F*(y)=0,3; |
При 67<y≤69 |
ny=17, F*(y)=0,85; |
При 51<y≤54 |
ny=8, F*(y)=0,4; |
При 69<y≤70 |
ny=19, F*(y)=0,95; |
При 54<y≤56 |
ny=9, F*(y)=0,45; |
При y>70 |
ny=20, F*(y)=1. |
При 56<y≤58 |
ny=11, F*(y)=0,55; |
|
|
Получили функцию:
0 |
y≤44 |
0,05 |
44<y≤48 |
0,15 |
48<y≤50 |
0,3 |
50<y≤51 |
0,4 |
51<y≤54 |
0,45 |
54<y≤56 |
0,55 |
56<y≤58 |
0,65 |
58<y≤60 |
0,75 |
60<y≤64 |
0,8 |
64<y≤67 |
0,85 |
67<y≤69 |
0,95 |
69<y≤70 |
1 |
y>70 |
График функции F*(y):
9). Вычисление , ,, , s, V по признаку РОСТ:
;
;
;
;
;
;
;
;
;
;
;
.
10). Определение , ,, , s, V по признаку ВЕС:
;
;
;
;
;
;
;
;
;
;
;
.
11). Нахождение коэффициента корреляции r(x,y):
Составим таблицу:
i |
xi |
yi |
xi*yi |
1 |
160 |
48 |
7680 |
2 |
168 |
58 |
9744 |
3 |
175 |
69 |
12075 |
4 |
169 |
64 |
10816 |
5 |
170 |
69 |
11730 |
6 |
169 |
70 |
11830 |
7 |
162 |
51 |
8262 |
8 |
166 |
60 |
9960 |
9 |
163 |
67 |
10921 |
10 |
160 |
54 |
8640 |
11 |
158 |
48 |
7584 |
12 |
173 |
58 |
10034 |
13 |
162 |
44 |
7128 |
14 |
173 |
50 |
8650 |
15 |
156 |
56 |
8736 |
16 |
158 |
56 |
8848 |
17 |
168 |
51 |
8568 |
18 |
170 |
50 |
8500 |
19 |
162 |
60 |
9720 |
20 |
155 |
50 |
7750 |
|
|
|
∑xi*yi =187176 |
, .
Из следует, что .
, ,
.
12). Проверка гипотезы о значимости полученного коэффициента корреляции:
Правило. Для того, чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1: rг ≠ 0, надо вычислить наблюдаемое значение критерия
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k=n-2 найти критическую точку tкр (α;k) двусторонней критической области. Если │Tнабл│< tкр - нет оснований отвергнуть нулевую гипотезу. Если │Tнабл │> tкр - нулевую гипотезу отвергают.
Уровень значимости α полагаем равным 0,05. Из n=20 и k=n-2 следует, что число степеней свободы k равно 18. Таким образом, tкр (α;k) = tкр (0,05; 18). По таблице критических точек распределения Стьюдента находим:
tкр (α;k) = tкр (0,05; 18) = 2,10.
Из следует, что
│Tнабл │> tкр. Поэтому отвергаем нулевую гипотезу.
13). Нахождение выборочного коэффициента регрессии :
.
Проверка:
;
.
14). Выборочное уравнение прямой линии регрессии ξ2 на ξ1 имеет вид:
y = ρв(x-xв) + yв, отсюда получаем y = 0,58*(x-164,85) + 56,65.
15). График выборочной регрессии и корреляционное поле: