[Нижегородский государственный педагогический университет
Учебные материалы >> Факультет метематики, информатики и физики]

 

Лабораторная работа № 2

Тема: «Вариационный ряд.

Числовые характеристики вариационного ряда. Статистические методы изучения зависимостей между  случайными величинами.»

 

Контрольные вопросы и задания.

 

1. Приведите определение математического ожидания дискретной (абсолютно непрерывной) случайной величины.

Примерный ответ: Математическим ожиданием дискретной случайной величины ξ называют сумму произведений всех ее возможных значений на их вероятности:

 

2. Является ли выборочное среднее несмещенной (состоятельной) оценкой математического ожидания?

Примерный ответ: Является.

Выборочное среднее в роли случайной величины

,

                                               

где n - объём выборки,

является несмещённой и состоятельной оценкой математического ожидания.

По выборочным данным x1, x2,…, xn находим значение выборочного среднего

.

 

3. Приведите определение дисперсии и среднего квадратического отклонения случайной величины.

Примерный ответ: Дисперсией случайной величины ξ называют математическое ожидание квадрата отклонения случайной величины от её математического ожидания:

D(ξ) = M[ξ - M(ξ)]2.

Дисперсию удобно вычислять по формуле:

D(ξ)=M(ξ 2) - [М(ξ)]2.

Средним квадратическим отклонением случайной величины называют квадратный корень из дисперсии:

.

 

4. Приведите определения следующих статистических оценок дисперсии: выборочная дисперсия и исправленная выборочная дисперсия. Укажите их свойства.

Примерный ответ: Выборочной дисперсией Dв называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их значений Xв:

.

Если значения признака x1, …, xn имеют соответственно частоты n1, …, nk, причём n1+…+nk=n, то выборочную дисперсию можно найти по формуле:

 

 

,

т.е. выборочная дисперсия есть среднее взвешенное квадратов отклонений с весами, равными соответствующим частотам.

Теорема. Выборочная дисперсия Dв равна среднему квадратов значений признака минус квадрат общей средней:

.

 

Выборочная дисперсия в роли случайной величины

является смещённой оценкой дисперсии:

 

                                                                              

Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии D(ξ). Достаточно для этого умножить на дробь n/(n-1). Сделав это, получим исправленную выборочную дисперсию:

.

Исправленная дисперсия является несмещённой оценкой генеральной дисперсии:

 

Итак, в качестве несмещённой оценки генеральной дисперсии принимают исправленную дисперсию:

.

            По выборочным данным x1, x2,…, xn найдём одно из возможных значений

несмещённой дисперсии s2 . Полученное значение обычно обозначается тем же символом s2 и так же называется выборочной дисперсией.

5. Как найти коэффициент вариации вариационного ряда?

Примерный ответ: Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней:

V=(σв/xв)*100%.

6. Приведите определение коэффициента корреляции  случайных величин ξ и η.

7. Как найти ковариацию ?

8. В каком случае случайные величины ξ и η называются: а) некоррелированными; б) независимыми?

9. Следует ли из независимости (некоррелированности) случайных величин ξ и η некоррелированность (независимость) этих случайных величин?

10. Приведите определение выборочной ковариации  и выборочного коэффициента корреляции  случайных величин ξ и η. Как по выборочным данным (x1,y1), (x2,y2), …, (xn,yn) вычислить значения  и  оценок ?

11. Приведите определение теоретической регрессии η на ξ. Укажите выборочное уравнение прямой линии регрессии η на ξ.

12. Как проводится проверка гипотезы о значимости выборочного коэффициента корреляции?

Задание.

 

Вариант №1

Соберите данные о значениях признака ξ1 (рост) и признака ξ2 (вес) у студенток группы.

Вариант №2

Соберите данные о значениях признака ξ3 (успеваемость по дисциплине «Дифференциальные уравнения и уравнения с частными производными») и признака ξ4 (успеваемость по дисциплине «Геометрия») у студентов группы.

Вариант №3

Соберите данные о значениях признака ξ3 (успеваемость по дисциплине «Дифференциальные уравнения и уравнения с частными производными») и признака ξ5 (успеваемость по дисциплине «История образования и педагогической мысли») у студентов группы.

Вариант №4

Соберите данные о значениях признака ξ1 (рост) и признака ξ3 (успеваемость по дисциплине «Дифференциальные уравнения и уравнения с частными производными») у студенток группы.

Вариант №5

Соберите данные о значениях признака ξ2 (вес) и признака ξ6 (успеваемость по дисциплине «Теория чисел») у студенток группы.

 

Цель работы:

 

1.   Овладение различными способами отбора статистических данных.

2.   Нахождение точечных характеристик вариационного ряда.

3.   Овладение методами установления связи между двумя случайными величинами, проверки статистической гипотезы о значимости выборочного коэффициента корреляции, построения выборочного уравнения прямой линии регрессии.

4.   Приобретение навыка работы со статистическими прикладными программами на ЭВМ.

 

Ход работы:

 

 

1). Исходная выборка по росту и весу:

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Рост

160

168

175

169

170

169

162

166

163

160

158

173

162

173

156

158

168

170

162

155

Вес

48

58

69

64

69

70

51

60

67

54

48

58

44

50

56

56

51

50

60

50

 

2). Определение объема выборки:

n=20, где n – объем выборки

 

3). Составление ранжированного ряда:

 

Рост

155

156

158

158

160

160

162

162

162

163

166

168

168

169

169

170

170

173

173

175

Вес

44

48

48

50

50

50

51

51

54

56

56

58

58

60

60

64

67

69

69

70

 

4). Составление вариационного ряда:

 

Рост

155

156

158

160

162

163

166

168

169

170

173

175

Вес

44

48

50

51

54

56

58

60

64

67

69

70

 

5). Составление таблицы с указанием статистического распределения частот и относительных частот признака РОСТ:

 

i

xi (ξ1)

ni

xini

xi2ni

ωi

1

155

1

155

24025

0,05

2

156

1

156

24336

0,05

3

158

2

316

49928

0,1

4

160

2

320

51200

0,1

5

162

3

486

78732

0,15

6

163

1

163

26569

0,05

7

166

1

166

27556

0,05

8

168

2

336

56448

0,1

9

169

2

338

57122

0,1

10

170

2

340

57800

0,1

11

173

2

346

59858

0,1

12

175

1

175

30625

0,05

ИТОГО:

Σni = 20

Σnixi=3297

Σnixi2=544199

Σ ωi  = 1

 

Проверка выполнения равенства n1+…+nk=n и ω1+…+ωk=1

1+1+2+2+3+1+1+2+2+2+2+1=20 (равенство выполняется)

0,05+0,05+0,1+0,1+0,15+0,05+0,05+0,1+0,1+0,1+0,1+0,05=1 (равенство выполняется)

 

5.1). Полигон абсолютных частот:

 

 

 

 

 

 

 

 

 

 

5.2). Полигон относительных частот:

 

 

6). Составление таблицы с указанием статистического распределения частот и относительных частот признака ВЕС:

 

i

yi

ni

yini

yi2ni

ωi

1

44

1

44

1936

0,05

2

48

2

96

4608

0,1

3

50

3

150

7500

0,15

4

51

2

102

5202

0,1

5

54

1

54

2916

0,05

6

56

2

112

6272

0,1

7

58

2

116

6728

0,1

8

60

2

120

7200

0,1

9

64

1

64

4096

0,05

10

67

1

67

4489

0,05

11

69

2

138

9522

0,1

12

70

1

70

4900

0,05

ИТОГО:

Σ ni = 20

Σ yini=1133

Σyi2ni=65369

Σ ωi = 1

 

Проверка выполнения равенства n1+…+nk=n и ω1+…+ωk=1

1+2+3+2+1+2+2+2+1+1+2+1=20 (равенство выполняется)

0,05+0,1+0,15+0,1+0,05+0,1+0,1+0,1+0,05+0,05+0,1+0,05=1 (равенство выполняется)

 

6.1). Полигон абсолютных частот:

 

 

 

6.2). Полигон относительных частот:

 

 

7). Составление эмпирической функции распределения вероятностей по признаку РОСТ и построение её графика:

 

где nx – накопленная частота, n -  объём выборки.

n=20

При x≤155

nx=0, F*(x)=0;

При 166<x≤168

nx=11, F*(x)=0,55;

При 155<x≤156

nx=1, F*(x)=0,05;

При 168<x≤169

nx=13, F*(x)=0,65;

При 156<x≤158

nx=2, F*(x)=0,1;

При 169<x≤170

nx=15, F*(x)=0,75;

При 158<x≤160

nx=4, F*(x)=0,2;

При 170<x≤173

nx=17, F*(x)=0,85;

При 160<x≤162

nx=6, F*(x)=0,3;

При 173<x≤175

nx=19, F*(x)=0,95;

При 162<x≤163

nx=9, F*(x)=0,45;

При x>175

nx=20, F*(x)=1;

При 163<x≤166

nx=10, F*(x)=0,5;

 

 

 

Получили функцию:

 

0

x≤155                      

0,05

155<x≤156

0,1

156<x≤158

0,2

158<x≤160

0,3

160<x≤162

0,45

162<x≤163

0,5

163<x≤166

0,55

166<x≤168

0,65

168<x≤169

0,75

169<x≤170

0,85

170<x≤173

0,95

173<x≤175

1

x>175

 

 

 

 

 

 

 

 

 

График функции F*(x):

 

 

8). Составление эмпирической функции распределения вероятностей по признаку ВЕС и построение её графика:

где ny – накопленная частота, n -  объём выборки.

n=20

При y≤44                      

ny=0, F*(y)=0;

При 58<y≤60                

ny=13, F*(y)=0,65;

При 44<y≤48                

ny=1, F*(y)=0,05;

При 60<y≤64                

ny=15, F*(y)=0,75;

При 48<y≤50                

ny=3, F*(y)=0,15;

При 64<y≤67                

ny=16, F*(y)=0,8;

При 50<y≤51                

ny=6, F*(y)=0,3;

При 67<y≤69                

ny=17, F*(y)=0,85;

При 51<y≤54                

ny=8, F*(y)=0,4;

При 69<y≤70                

ny=19, F*(y)=0,95;

При 54<y≤56                

ny=9, F*(y)=0,45;

При y>70                       

ny=20, F*(y)=1.

При 56<y≤58                

ny=11, F*(y)=0,55;

 

 

 

 

 

Получили функцию:

 

0

y≤44                      

0,05

44<y≤48                

0,15

48<y≤50                 

0,3

50<y≤51                

0,4

51<y≤54                

0,45

54<y≤56                

0,55

56<y≤58                

0,65

58<y≤60                

0,75

60<y≤64                

0,8

64<y≤67                

0,85

67<y≤69                

0,95

69<y≤70                

1

y>70                       

 

График функции F*(y):

 

 

9). Вычисление , ,, , s, V  по признаку РОСТ:

 

;

;

;

;

;    

;

;

;

;

;

;

.

10). Определение , ,, , s, V по признаку ВЕС:

 

;

;

;

;

;    

;

;

;

;

;

;

.

   

11). Нахождение коэффициента корреляции r(x,y):

 

Составим таблицу:

 

i

xi

yi

xi*yi

1

160

48

7680

2

168

58

9744

3

175

69

12075

4

169

64

10816

5

170

69

11730

6

169

70

11830

7

162

51

8262

8

166

60

9960

9

163

67

10921

10

160

54

8640

11

158

48

7584

12

173

58

10034

13

162

44

7128

14

173

50

8650

15

156

56

8736

16

158

56

8848

17

168

51

8568

18

170

50

8500

19

162

60

9720

20

155

50

7750

 

 

 

xi*yi =187176

, .

Из  следует, что .

, ,

.

 

12). Проверка гипотезы о значимости полученного коэффициента корреляции:

 

Правило. Для того, чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1: rг ≠ 0, надо вычислить наблюдаемое значение критерия

          

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k=n-2 найти критическую точку tкр (α;k) двусторонней критической области. Если ‌‌│Tнабл│< tкр - нет оснований отвергнуть нулевую гипотезу. Если │Tнабл │> tкр - нулевую гипотезу отвергают.

 

Уровень значимости α полагаем равным 0,05. Из n=20 и k=n-2 следует, что число степеней свободы k равно 18. Таким образом, tкр (α;k) = tкр (0,05; 18). По таблице критических точек распределения Стьюдента находим:

tкр (α;k) = tкр (0,05; 18) = 2,10.

Из  следует, что

Tнабл │> tкр. Поэтому отвергаем нулевую гипотезу.

13). Нахождение выборочного коэффициента регрессии :     

.

 

 

Проверка:

 

;

. 

14). Выборочное уравнение прямой линии регрессии ξ2 на ξ1 имеет вид:

Подпись:
 


y = ρв(x-xв) + yв, отсюда получаем  y = 0,58*(x-164,85) + 56,65.

 

 

15). График выборочной регрессии и корреляционное поле: