II Всероссийская конференция пользователей MATLAB, 25-26 мая 2004 года >>
На первую страницу
Рубрика Matlab&Toolboxes
Российские MATLAB-разработки
Вход
Раздел "Математика\Statistics Toolbox"

Список функций Statistics Toolbox

ANOVA2
Двухфакторный дисперсионный анализ

Синтаксис

p = anova2(X,reps) 
p = anova2(X,reps,'displayopt') 
[p,table] = anova2(...)
[p,table,stats] = anova2(...)

Описание

anova2(X,reps) функция позволяет провести двухфакторный дисперсионный анализ для сравнения средних арифметических значений m столбцов и n строк в матрице Х. Данные в столбцах и строках соответствуют разным уровням факторов А и В. Количество повторных наблюдений для всех комбинаций уровней факторов А и В задается входным аргументов reps. Значение reps должно быть постоянным целым числом. Дисперсионный анализ для переменного числа наблюдений по уровням факторов используется функция многофакторного дисперсионного анализа anovan.

Если фактор А имеет два уровня, фактор В - три уровня и рассматриваются два наблюдения для сочетаний уровней факторов А и В (reps=2), то матрица Х примет следующий вид

При reps=1 (значение по умолчанию) функция anova2 позволяет рассчитать вектор уровней значимости р, содержащий два элемента. Если количество повторений reps>1, anova2 возвращает вектор p с 3 элементами. Назначение элементов вектора р:

1. уровень значимости р(1) нулевой гипотезы, H0A, состоящей в том, что все выборки соответствующие уровням фактора А, т.е. все столбцы в матрице Х, извлечены из той же генеральной совокупности;

2. уровень значимости р(2) нулевой гипотезы, H, состоящей в том, что все выборки соответствующие уровням фактора В, т.е. все строки в матрице Х, извлечены из той же генеральной совокупности;

3. уровень значимости р нулевой гипотезы, H0АВ, состоящей в том, что отсутствует эффект взаимодействия между факторами А и В. Для reps>1.

p является вероятностью ошибки первого рода, или вероятностью необоснованно отвергнуть нулевую гипотезу. Если значение p близко к нулю, то нулевая гипотеза может быть отвергнута. р≈0 для гипотезы H0A означает, что хотя бы одно из средних арифметических, рассчитанных по столбцам, отличается от остальных значений, т.е. существует значимый главный эффект фактора А. р≈0 для гипотезы H означает, что хотя бы одно из средних арифметических, рассчитанных по строкам, отличается от остальных значений, т.е. существует значимый главный эффект фактора В. р≈0 для гипотезы H0АВ означает, что существует значимый эффект взаимодействия между факторами А и В.

Выбор критического уровня значимости для условия принятия нулевой гипотезы

,

предоставлен исследователю. В большинстве практических случаев принимают равным 0,05; 0,01.

При проведении дисперсионного анализа общая дисперсия делится на 3 или 4 составляющие в зависимости от значения reps:

  • дисперсия между средними арифметическими по столбцам Х (дисперсия между средними арифметическими по фактору А);

  • дисперсия между средними арифметическими по строкам Х (дисперсия между средними арифметическими по фактору В);

  • дисперсия, обусловленная взаимодействием между строками и столбцами Х (рассчитывается, если reps>1);

  • остаточная дисперсия.

Таблица с результатами двухфакторного дисперсионного анализа отображается в графическом окне и содержит 6 столбцов (рис. 1):

  1. вид дисперсии (Source):

    § дисперсия между средними арифметическими по столбцам Х (Columns),

    § дисперсия между средними арифметическими по строкам Х (Rows),

    § дисперсия обусловленная взаимодействием между строками и столбцами Х (Interaction),

    § остаточная дисперсия (Error)

    § общая дисперсия (Total);

  2. сумму квадратов разностей (SS) между средним арифметическим и значениями выборки по каждому виду дисперсии;

  3. число степеней свободы по каждому виду дисперсии (df);

  4. среднее значение суммы квадратов разностей (MS) по каждому виду дисперсии, определяемое как отношение SS/df;

  5. значение статистики Фишера (F статистики) для MS;

  6. значение уровня значимости p (Prob>F) для рассчитанного значения статистики F. Если величина F увеличивается, то значение p должно уменьшаться.

    Рис. 1. Таблица двухфакторного дисперсионного анализа.

    p = anova2(X,reps,'displayopt') входной аргумент 'displayopt' позволяет отобразить графическое окно с таблицей результатов дисперсионного анализа 'displayopt'='on', или подавить вывод графического окна 'displayopt'='off'. Значение по умолчанию 'displayopt'='on'.

    [p,table] = anova2(...) функция возвращает таблицу с результатами двухфакторного дисперсионного анализа в текстовой форме в командное окно MATLAB.

    [p,table,stats] = anova2(...) функция возвращает структуру stats используемую для проведения парных сравнений средних арифметических выборок. Проверка параметрической гипотезы о равенстве двух средних арифметических выполняется при помощи функции multcompare. Структура данных stats передается функции multcompare как входной аргумент.

    Примеры использования функции двухфакторного дисперсионного анализа

    Двухфакторный дисперсионный анализ для шести уровней по каждому фактору и единичному числу повторений.

    >> X = unifrnd(0,1,6,6);

    >> p = anova2(X,1)

    p =

    0.1530 0.9926

    Двухфакторный дисперсионный анализ для шести уровней по первому фактору, двум уровням по второму фактору и 3-х повторений.

    >> X = normrnd(0,1,6,6);

    >> p = anova2(X,3)

    p =

    0.8380 0.9897 0.2309

    Двухфакторный дисперсионный анализ для шести уровней по первому фактору, двум уровням по второму фактору и 3-х повторений. Функция возвращает вектор уровней значимости р, таблицу двухфакторного дисперсионного анализа table, структуру stats для парных сравнений средних арифметических выборок.

    >> X = normrnd(0,1,6,6);
    >> [p,table,stats] = anova2(X,3)
    p =
        0.1751    0.4596    0.0366
    table = 
        'Source'         'SS'         'df'    'MS'        'F'         'Prob>F'
        'Columns'        [ 5.2429]    [ 5]    [1.0486]    [1.6911]    [0.1751]
        'Rows'           [ 0.3502]    [ 1]    [0.3502]    [0.5648]    [0.4596]
        'Interaction'    [ 8.8611]    [ 5]    [1.7722]    [2.8582]    [0.0366]
        'Error'          [14.8813]    [24]    [0.6201]          []          []
        'Total'          [29.3355]    [35]          []          []          []
    stats = 
          source: 'anova2'
         sigmasq: 0.6201
        colmeans: [-0.2958 0.0404 -0.6404 0.2944 0.4974 -0.2469]
            coln: 6
        rowmeans: [0.0401 -0.1571]
            rown: 18
           inter: 1
            pval: 0.0366
              df: 24
    

    В оглавление \ К следующему разделу \ К предыдущему разделу


О получении локальных копий сайтов
  Всероссийская научная конференция "Проектирование научных и инженерных приложений в среде MATLAB" (май 2002 г.)
На первую страницу \ Сотрудничество \ MathWorks \ SoftLine \ Exponenta.ru \ Exponenta Pro   
E-mail:    
  Информация на сайте была обновлена 11.05.2004 Copyright 2001-2004 SoftLine Co 
Наши баннеры