II Всероссийская конференция пользователей MATLAB, 25-26 мая 2004 года >>
На первую страницу
Рубрика Matlab&Toolboxes
Российские MATLAB-разработки
Вход
Раздел "Математика\Statistics Toolbox"

Список функций Statistics Toolbox

В оглавление \ К следующему разделу \ К предыдущему разделу

ANOVA1
Однофакторный дисперсионный анализ (ANOVA)

Синтаксис

p = anova1(X)
p = anova1(X,group)
p = anova1(X,group,'displayopt')
[p,table] = anova1(...)
[p,table,stats] = anova1(...)

Описание

p = anova1(X) функция позволяет провести однофакторный дисперсионный анализ для сравнения средних арифметических значений одной или нескольких выборок одинакового объема. Выборки определяются входным аргументом Х. Х задается как матрица с размерностью mxn, где m - число наблюдений в выборке (число строк Х), n - количество выборок (число столбцов матрицы Х). Выборки должны быть независимыми. Выходным аргументом функции является уровень значимости p нулевой гипотезы. Нулевая гипотеза состоит в том, что все выборки в матрице Х взяты из одной генеральной совокупности или из разных генеральных совокупностей с равными средними арифметическими. p является вероятностью ошибки первого рода, или вероятностью необоснованно отвергнуть нулевую гипотезу. Если значение p0, то нулевая гипотеза может быть отвергнута, т.е. хотя бы одно среднее арифметическое отличается от остальных значений. Выбор критического уровня значимости pKP для условия принятия нулевой гипотезы

предоставлен исследователю. В большинстве практических случаев pKP принимают равным 0,05; 0,01.

При проведении дисперсионного анализа общая дисперсия делится на две составляющие:

  • межгрупповую дисперсию - дисперсию средних арифметических значений выборок матрицы Х относительно общего среднего;
  • внутригрупповую дисперсию - дисперсию значений выборок относительно выборочных средних.

Результаты расчета отображаются в двух графических окнах. В первое окно выводится таблица с результатами однофакторного дисперсионного анализа, во втрое - диаграмма размаха для средних арифметических по заданным выборкам.

Таблица с результатами однофакторного дисперсионного анализа содержит 6 столбцов (рис. 1):

  1. вид дисперсии (Source):
    • внутригрупповая (Columns),
    • межгрупповая (Error),
    • общая (Total);
  2. сумму квадратов разностей (SS) между средним арифметическим и значениями выборки по каждому виду дисперсии;
  3. число степеней свободы по каждому виду дисперсии (df);
  4. среднее значение суммы квадратов разностей (MS) по каждому виду дисперсии, определяемое как отношение SS/df;
  5. значение статистики Фишера (F статистики) для MS;
  6. значение уровня значимости p (Prob>F) для рассчитанного значения статистики F. Если величина F увеличивается, то значение p должно уменьшаться.

Рис. 1. Таблица однофакторного дисперсионного анализа.

Диаграмма размаха средних арифметических значений строится по выборкам, т.е. по столбцам матрицы Х, и является аналогом диаграммы размаха для медиан выборок, получаемой при помощи функции boxplot. Чем больше разница между центральными линиями на диаграмме размаха (средними арифметическими выборок), тем больше разница между выборочными значениями статистики F и меньше соответствующие значения уровня значимости p.

p = anova1(X,group) входной аргумент group задает метки выборок Х и названий соответствующих им графиков на диаграмме размаха. Метки выборок group задаются вектором строк или массивом ячеек. Число элементов вектора group должно быть равно количеству столбцов матрицы Х.

Выборки могут быть заданы как вектор Х. Деление элементов Х на выборки выполняется при помощи входного аргумента group. group может быть задан вектор, символьный массив (вектор строк) или массив ячеек. Принадлежность элемента вектора Х к выборке определяется одинаковым значением соответствующего элемента вектора group. Размерность векторов Х и group должна совпадать. Значения вектора group являются метками соответствующих графиков выборок на диаграмме размаха средних арифметических.

Векторная форма задания выборок Х по группирующей переменной group позволяет проводить однофакторный дисперсионный анализ по выборкам неодинакового объема. Если элемент вектора группирующей переменной groupi содержит пустую строку, пустую ячейку массива или нечисловое значение NaN, то соответствующий элемент данных в векторе Х игнорируется при расчете.

p = anova1(X,group,'displayopt') входной аргумент 'displayopt' позволяет явно задать отображение графических окон с таблицей результатов дисперсионного анализа и диаграммой размаха 'displayopt'='on', или подавить вывод графических окон 'displayopt'='off'. Значение по умолчанию 'displayopt'='on'.

[p,table] = anova1(...) функция возвращает таблицу с результатами однофакторного дисперсионного анализа в текстовой форме в командное окно MATLAB.

[p,table,stats] = anova1(...) функция возвращает структуру stats используемую для проведения парных сравнений средних арифметических выборок. Проверка параметрической гипотезы о равенстве двух средних арифметических выполняется при помощи функции multcompare. Структура данных stats передается функции multcompare как входной аргумент.

Однофакторный дисперсионный анализ основан на следующих предположениях:

  1. выборки распределены нормально;
  2. выборки имеют одинаковую дисперсию;
  3. наблюдения в выборках взаимно независимы.
Однофакторный дисперсионный анализ нечувствителен к малым отклонениям от первого и второго условий.

Примеры использования функции однофакторного дисперсионного анализа

Однофакторный дисперсионный анализ для пяти выборок с математическими ожиданиями изменяющимися 
в пределах от 1 до 5.

>> X = meshgrid(1:5)
X =
     1     2     3     4     5
     1     2     3     4     5
     1     2     3     4     5
     1     2     3     4     5
     1     2     3     4     5
>> X = X + normrnd(0,1,5,5)
X =
    0.5674    3.1909    2.8133    4.1139    5.2944
   -0.6656    3.1892    3.7258    5.0668    3.6638
    1.1253    1.9624    2.4117    4.0593    5.7143
    1.2877    2.3273    5.1832    3.9044    6.6236
   -0.1465    2.1746    2.8636    3.1677    4.3082
>> p = anova1(X)
p =
  1.2765e-006
Однофакторный дисперсионный анализ для пяти выборок с математическими ожиданиями, 
изменяющимися в пределах от 1 до 5. Метки выборок заданы переменной group.

>> X = meshgrid(1:5)
X =
     1     2     3     4     5
     1     2     3     4     5
     1     2     3     4     5
     1     2     3     4     5
     1     2     3     4     5
>> X = X + normrnd(0,1,5,5)
X =
    0.5674    3.1909    2.8133    4.1139    5.2944
   -0.6656    3.1892    3.7258    5.0668    3.6638
    1.1253    1.9624    2.4117    4.0593    5.7143
    1.2877    2.3273    5.1832    3.9044    6.6236
   -0.1465    2.1746    2.8636    3.1677    4.3082
>> group = ['Aa'; 'Bb'; 'Cc'; 'Dd'; 'Ee']
group =
Aa
Bb
Cc
Dd
Ee
>> p = anova1(X, group)
p =
  1.2765e-006
Однофакторный дисперсионный анализ для пяти выборок с переменным объемом. 
Группировка значений вектора Х по выборкам выполняется вектором целых чисел group.

>> X = normrnd(0,1,104,1);
>> group = unidrnd(4,104,1);
>> p = anova1(X, group)
p =
    0.5473

Однофакторный дисперсионный анализ для пяти выборок с математическими ожиданиями, изменяющимися в пределах от 1 до 5. Метки выборок заданы переменной group. Функция возвращает таблицу с результатами однофакторного дисперсионного анализа в текстовой форме в командное окно MATLAB. Функция anova1 возвращает структуру данных stats.

>> X = meshgrid(1:5);
>> X = X + normrnd(0,1,5,5);
>> group = ['Aa'; 'Bb'; 'Cc'; 'Dd'; 'Ee'];
>> [p,table,stats] = anova1(X, group)
p =
  4.3652e-005
table = 
  Columns 1 through 5
    'Source'     'SS'         'df'    'MS'        'F'      
    'Columns'    [37.0002]    [ 4]    [9.2501]    [11.8040]
    'Error'      [15.6728]    [20]    [0.7836]           []
    'Total'      [52.6730]    [24]          []           []
  Column 6
    'Prob>F'     
    [4.3652e-005]
               []
               []
stats = 
    gnames: {5x1 cell}
         n: [5 5 5 5 5]
    source: 'anova1'
     means: [1.1484 2.1861 3.1478 3.6339 4.7007]
        df: 20
         s: 0.8852
>> stats.gnames
ans = 
    'Aa'
    'Bb'
    'Cc'
    'Dd'
    'Ee'

В оглавление \ К следующему разделу \ К предыдущему разделу


О получении локальных копий сайтов
  Всероссийская научная конференция "Проектирование научных и инженерных приложений в среде MATLAB" (май 2002 г.)
На первую страницу \ Сотрудничество \ MathWorks \ SoftLine \ Exponenta.ru \ Exponenta Pro   
E-mail:    
  Информация на сайте была обновлена 11.05.2004 Copyright 2001-2004 SoftLine Co 
Наши баннеры