Филиал федерального государственного бюджетного образовательного учреждения



жүктеу 1.66 Mb.
бет1/10
Дата28.02.2019
өлшемі1.66 Mb.
  1   2   3   4   5   6   7   8   9   10


ФИЛИАЛ ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО

ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ГЛАЗОВСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ

ИМЕНИ В.Г. КОРОЛЕНКО» В Г. ИЖЕВСКЕ

Т.А. Снигирева, И.А. Гришанова

МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ

ПСИХОЛОГО-ПЕДАГОГИЧЕСКОГО ИССЛЕДОВАНИЯ

Ижевск 2013
УДК 37.012.4:159.9.072(07)

ББК 74.00в631.8.я7+88 в631.8.я7

С 535
Рекомендовано кафедрой педагогики Филиала ФГБОУ ВПО «Глазовский

государственный педагогический институт им. В.Г. Короленко» в г. Ижевске


Рецензенты:

О.Ф. Шихова, д-р пед. наук, проф. (ИжГТУ, г. Ижевск)

А.О. Куракина, канд. пед. наук, доцент (ФГГПИ, г. Ижевск)

Снигирева, Т.А.



Методы статистической обработки результатов психолого-педагогического исследования : учебно-методическое пособие / Т.А. Снигирева, И.А. Гришанова. – Изд-во ФГБОУ ВПО «УдГУ», Ижевск, 2013. – 70 с.
В учебно-методическом пособии изложены научно-организационные основы и педагогические особенности, которые необходимо учитывать при проведении статистической обработки результатов выпускных квалификационных работ. Данное пособие имеет обобщающий характер и позволяет студентам закрепить основные понятия, используемые в математической обработке данных эмпирического исследования. Адресовано студентам педагогических институтов, обучающимся по профилям: начальное образование, дошкольное образование, логопедия, психология и социальная педагогика.

© Снигирева Т.А.,2013

© Гришанова И.А., 2013

Оглавление


Введение ………………………………………………………………………

4

Глава 1. Теоретические основы математической обработки результатов психолого-педагогического исследования…………………………….

5

1.1. Генеральная и выборочная совокупность…………………………...

5

1.2. Основные понятия статистических методов исследования………..

9

1.3. Параметрические критерии проверки статистических гипотез…….

13

1.4. Непараметрические критерии проверки статистических гипотез….

19

Глава 2. Практические основы математической обработки результатов психолого-педагогического исследования…………………………....

26

2.1. G – критерий знаков…………………………………………………...

26

2.2. Т – критерий Вилкоксона……………………………………………...

30

2.3. Угловой критерий Фишера – φ*……………………………………...

36

2.4. Q – критерий Розенбаума……………………………………………..

42

2.5. U – критерий Манна-Уитни…………………………………………..

46

2.6. Оценка достоверности сдвига в значениях исследуемого признака при сопоставлении трех и более замеров. ………………………………….

52


2.6.1. Критерий Фридмана ()…………………………………………..

52

2.6.2. Критерий тенденций Пейджа (L)…………………………………..

56

Литература …………………………………………………………………..

61

Приложения…………………………………………………………………..

62

Введение

Психолого-педагогические исследования, в зависимости от степени сложности, делятся на обзорно-аналитические, обзорно-критические, теоретические, эмпирические описательные, эмпирические объяснительные, методические и экспериментальные. Наиболее сложным является экспериментальное исследование, но именно оно делает выпускную квалификационную работу самостоятельным научно-исследовательским трудом студента.

При проведении экспериментального исследования возникает необходимость количественной обработки полученных данных с помощью математических методов. Это позволяет определить закономерности развития явлений, статистически значимые связи между различными психолого-педагогическими феноменами и их характеристиками, доказать эффективность тех или иных воздействий на объект исследования в ходе эксперимента.

Учебно-методическое пособие знакомит студентов с основными понятиями, необходимыми для проведения процедуры математической обработки данных эмпирического исследования, содержит описание, назначение, ограничения и алгоритм расчета основных статистических критериев.

В учебно-методическом пособии содержатся таблицы критических значений всех рассмотренных статистических критериев.

Основная цель данного учебно-методического пособия – помочь студентам закрепить основные понятия, используемые в математической обработке данных эмпирического исследования, выбрать соответствующий содержанию и целям эмпирического исследования критерий и провести статистическую обработку полученных результатов.



Глава 1. Теоретические основы математической обработки результатов психолого-педагогического исследования

1.1. Генеральная и выборочная совокупность

Математическая статистика – раздел математики, который занимается разработкой методов анализа экспериментальных данных, полученных в результате наблюдения массовых случайных событий. Теоретическая база – теория вероятностей. Приведем описание основных понятий математической статистики.

Любое исследование, в том числе и педагогическое, начинается с построения выборки испытуемых. От того, насколько качественно построена выборка, зависит корректность обработки экспериментальных данных.

Статистическая совокупность – это совокупность значений х1 х2 … хi … хn случайной величины Х, получаемых в результате n испытаний.

Генеральная совокупность (от лат. generalus – всеобщий (главный)) – называется вся совокупность объектов определенного вида, представляющая изучаемое явление. Число объектов генеральной совокупности называют ее объемом и обозначают N.

Исследование всех без исключения объектов генеральной совокупности называется сплошным.

Например, генеральная совокупность – все население страны; сплошное исследование – всеобщая перепись населения.

Сплошное исследование трудоемко, дорого, порой не целесообразно, практически невозможно, поэтому из генеральной совокупности выбирают для изучения часть объектов.



Выборочной совокупностью (выборкой) называют часть генеральной совокупности отобранной для исследования. Число объектов выборки называют ее объемом и обозначают n.

Например, все студенты медицинских вузов России – генеральная совокупность; студенты лечебного факультета медицинской академии – выборочная совокупность.

Установлено, что определение объема выборки зависит от:

1) задач и условий проведения исследования;

2) вида проводимого эксперимента (фундаментальное исследование, получение экспресс-информации, составление прогноза по результатам исследования и т.д.);

3) степени однородности генеральной совокупности;

4) вероятности, с которой гарантируется достоверность результата.

Объем выборочной совокупности рассчитывают в основном четырьмя способами:

1) по изменению дисперсии;

2) по таблицам достаточно больших чисел и номограммам больших чисел;

3) по среднему квадратическому отклонению;

4) по формулам математической статистики.

Подробно все четыре способа описаны в работе А.Н. Майорова [6]. Приведем описание четвертого способа (расчеты объема выборки по статистическим формулам).

Для расчета объема выборки используют следующую формулу



,

где n – объем выборки; t – мера риска допущения ошибки, связанной с выборкой – предельная ошибка равна t-кратному числу предельных ошибок выборки. Табличные значения этой величины следующие: t = 1,96 при  = 0,05; t = 2,58 при  = 0,01. Для расчетов принимают t = 1,96  2; t = 2,58  3.



(правило «шести сигм»; если ); стандартное отклонение; 2 – дисперсия; N – объем генеральной совокупности;  – предельная ошибка репрезентативности; задается обычно в пределах от 0,01 до 0,1 с наиболее частым употреблением 5% (0,05).

Рассчитанные четырьмя различными способами объемы выборок дают примерно одинаковые результаты.

Для педагогического исследования большее значение имеет не объем выборочной совокупности, а ее репрезентативность, которая зависит не только от ее объема.



Репрезентативность предполагает близость характеристик генеральной совокупности и выборочной совокупности по основным стратифицированным переменным (representatis – франц. – показательный; stratum – лат. – слой – в социологии выборки однородных объектов – респондентов по возрасту, социальному положению, профессии, полу и т.п.).

Для образовательных учреждений основными стратифицирующими переменными являются:

1. Тип образовательного учреждения (вуз, ССУЗ, ПТУ, школа, лицей и т.д.).

2. Тип образовательной программы, выделенный по двум основаниям:

по уровню преподавания (коррекционная (компенсирующего обучения), базового уровня или повышенного);

по профилю (физико-математический, естественнонаучный, гуманитарный, эстетический, военно-спортивный, профессионального обучения и т.п.).

3. Статус образовательного учреждения (университет, академия, институт; начальная школа, неполного среднего, полного среднего образования, НПО, СПО и т.п.).

4. Географическое размещение образовательного учреждения (город, поселок, село; центр крупного мегаполиса, «спальный район» и т.п.).

5. Пол обучаемых (муж., жен., смешанная группа).

В зависимости от целей исследования количество страт может быть уменьшено. Например, если педагогическое исследование проводится в однотипных образовательных учреждениях, одного статуса, одного уровня преподавания (например, базового в школе), одного профиля и в одной местности (городе) остается 2 страты – по половому различию.

При формировании двух выборок из генеральной совокупности контрольной (КГ) и экспериментальной (ЭГ) обе выборки должны быть «уравновешены» друг с другом (в начале эксперимента) по полу, возрасту, профессии, уровню обученности и другим значимым для исследования характеристикам.

Опыт показывает, что создать «уравновешенные» подгруппы (даже КГ и ЭГ) практически невозможно, поэтому в педагогическом эксперименте рассматривают несколько видов репрезентативности.



Репрезентативность методов педагогического эксперимента означает, что и в КГ и ЭГ используются одни и те же методы исследования или их комплексы (наблюдение, анкетирование, моделирование, тестирование, экспертиза и т.д.). И сравнивать результаты педагогического эксперимента следует по методам их получения раздельно и в каждой страте.

Репрезентативность инструментария педагогического эксперимента означает разнообразие методов диагностики (разнообразие педагогических контрольно-измерительных материалов, форм тестовых заданий), применяемых в КГ и ЭГ.

Репрезентативность выборок по стратам в КГ и ЭГ.

Репрезентативность «масштабная» означает зависимость объема КГ и ЭГ от масштаба педагогического эксперимента (отдельное образовательное учреждение; группа однотипных образовательных учреждений; в районе, городе, республике, РФ и т.д.), причем, по каждой страте генеральной совокупности.

Репрезентативность «статистическая» означает использование при обработке результатов педагогического эксперимента в ЭГ и КГ единого аппарата математической статистики.

При разделении первичных данных, полученных на выборке, на классы или категории с целью получить обобщенную упорядоченную картину, позволяющую их анализировать, различают три типа данных (количественные, порядковые и качественные).

Количественные данные получают при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирования и т.п.). Их можно распределить по шкале с равными интервалами.

Порядковые данные – это данные, соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастающем порядке (1-й, ... 7-й, …, 100-й,; А, Б, В. ...).

Качественные данные представляют собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости.
1.2. Основные понятия статистических методов исследования
Статистический метод – метод, позволяющий делать обобщение или вычислять степень корреляции полученных экспериментальных данных.

Существуют две разновидности статистических методов. Первая разновидность – это наиболее широко применяемые параметрические методы, в которых используются такие параметры, как среднее значение или дисперсия данных.

Вторая разновидность – это непараметрические методы, оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения, как расчетов, так и применения. Более подробно эти методы рассмотрим позднее.

Приведем описание основных понятий статистических методов исследования.



Статистические гипотезы

Гипотеза – предположение об отсутствии или наличии различий в исследуемых объектах или явлениях.

При этом возможны две гипотезы:

1) нулевая гипотеза – это гипотеза об отсутствии различий в исследуемых объектах или явлениях (обычно она обозначается Н0 и называется нулевой).

2) альтернативная (экспериментальная или рабочая) гипотеза – это гипотеза о значимости различий (Н1), это то, что мы хотим доказать.



Проверка гипотез

Основной принцип метода проверки гипотез состоит в том, что пытаются опровергнуть выдвинутую нулевую гипотезу Н0, и тем самым подтвердить альтернативную гипотезу Н1. Если результаты статистического теста, используемого для анализа разницы между средними, окажутся таковы, что позволят отбросить Н0, это будет означать, что верна Н1, т.е. выдвинутая рабочая гипотеза подтверждается. В гуманитарных науках принято считать, что нулевую гипотезу можно отвергнуть в пользу альтернативной гипотезы, если по результатам статистического теста вероятность случайного возникновения найденного различия не превышает 5 из 100.



Критерии статистической оценки различий

Проверка гипотез осуществляется с помощью критериев статистической оценки различий.



Статистический критерий (СК) – это решающее правило, обеспечивающее надежное поведение, то есть принятие истиной и отклонение ложной гипотезы с высокой вероятностью.

Уровни статистической значимости

Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Например, когда мы указываем, что различия достоверны на 5% - ом уровне значимости, то вероятность того, что они все-таки недостоверны, составляет 0,05. (α = 0,05;
α
– уровень значимости или обозначают как р ≤ 0,05).

Уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна. Если вероятность ошибки α, то вероятность правильного решения

1 – α = γ,

где γ – доверительная вероятность, т.е. γ = 1 – α или α + γ = 1.

Правило отклонения Н0 и принятия Н1:

 если (СК)эмп ≥ (СК)кр при α = 0,05 (или р ≤ 0,05), то Н0 отклоняется, но мы еще не можем определенно принять Н1;

 если же (СК)эмп ≥ (СК)кр при α = 0,01 (или р ≤ 0,01), то Н0 отклоняется и принимается Н1.

Исключения: для критериев знаков (G), Вилкоксона (Т) и Манна-Уитни (U) устанавливаются обратные соотношения, т.е. (СК)эмп ≤ (СК)кр

Мощность критерияспособность выявлять различия, если они есть. Она определяется опытным путем. Более мощным критерием считается тот критерий, который выявляет различия при меньшем значении α, т.е. СК (α = 0,01) более мощный, чем СК (α = 0,05).

Возможности и ограничения статистических критериев

Для количественных данных при распределениях, близких к нормальным, используют параметрические методы. К параметрическим относятся те критерии, в формулу расчета которых входят параметры распределения, т.е. (выборочное среднее (математическое ожидание выборки), σ (среднее квадратическое отклонение). Например, t – критерий Стьюдента, Фишера и др. [1, 4].

В случае когда нет уверенности в том, что выполняется нормальный закон распределения используют нeпараметрические методы. К непараметрическим относятся те критерии, которые основаны на оперировании частотами или рангами, но не используются параметры распределения, например, Q – критерий Розенбаума, Т – критерий Вилкоксона и др.

Возможности и ограничения статистических критериев приведены в таблице 1.


Таблица 1. Возможности и ограничения статистических критериев

Возможности

критериев



Ограничения, условия

Рекомендуемые

критерии


Параметрические критерии

Позволяют прямо оценить различия в средних

Только в двух выборках с распределением Гаусса

t-критерий

Стьюдента



Позволяют прямо оценить различия в дисперсиях

Сопоставляются два нормальных распределения

Критерий

Фишера F



Позволяют выявить тенденции измерения признака при изменении условий (два и более факторов)

Распределения нормальные. Измерения по интервальной шкале (для всех указанных вариантов)

Дисперсионный одно- и двухфакторный анализ

продолжение табл. 1



Непараметрические критерии

Позволяют оценить лишь средние тенденции

Чаще ли в выборке А встречаются более высокие значения, а в выборке Б – низкие

Критерий Розенбаума (Q), Манна-Уитни (U), Угловое преобразование Фишера – φ*

Позволяют оценить лишь различия в диапазонах вариативности признака

Сопоставляются 2 выборки в процентных долях

Угловое преобразование Фишера – φ*

Позволяют выявить тенденции изменения признака при изменении условий эксперимента

Распределение признака любое (во всех вариантах измерения могут быть в любой шкале)

Критерии тенденций: Джонкира (S), Пейджа (L)

Из приведенной таблицы видно, что параметрические критерии могут оказаться более «мощными», чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. Непараметрические критерии лишены всех этих ограничений, менее трудоемки, но с их помощью невозможно оценить взаимодействие двух или более факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.


1.3. Параметрические методы проверки статистических гипотез
Для использования параметрических методов необходимы три условия: данные должны быть количественными, их число должно быть достаточным, а их распределение – нормальным. Во всех остальных случаях всегда рекомендуется использовать непараметрические методы.

Закон нормального распределения (закон Гаусса)

Нормальный закон распределения (часто называемый законом Гаусса) играет важную роль в теории вероятностей и занимает среди других законов распределения особое положение. Это – наиболее часто встречающийся на практике закон распределения. Главная особенность, выделяющая нормальный закон среди других законов, состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях [1, 7, 8].

Нормальный закон распределения характеризуется плотностью вероятности вида

,

где – функция нормального распределения (плотность распределения вероятности); М – математическое ожидание; – среднее квадратическое отклонение.

Кривая распределения по нормальному закону имеет симметричный колокообразный вид (рис. 1). Максимальная ордината кривой, равная , соответствует точке ; по мере удаления от точки M плотность распределения падает, и при кривая асимптотически приближается к оси абсцисс.

Рисунок 1. Кривая нормального распределения



Признаки нормального закона распределения:

1) большинство значений случайной величины группируется относительно математического ожидания; вероятность появления математического ожидания (среднего) максимальна;

2) вероятность появления меньших и больших значений относительно мала.

График функции имеет колокообразную форму, симметричный относительно математического ожидания.

Для выбора статистического метода исследования необходимо определить, подчиняется ли данная выборка объектов нормальному закону распределения. Рассмотрим один из способов.

Задача. Проверить, подчиняются ли количественные данные, полученные в результате измерения нормальному закону?

10 12 13 14 14 15 15 15 17 17 17 18 19 19 22


(данные необходимо проранжировать (упорядочить по возрастанию или убыванию значений)

1. Подсчитать общее количество значений n = 15

2. Составить таблицу


Xi

10

12

13

14

15

17

18

19

22

Σ

mi

1

1

1

2

3

3

1

2

1




Pi

1/15

1/15

1/15

2/15

3/15

3/15

1/15

2/15

1/15

1

3. Проверить условие нормировки

4. Вычислить математическое ожидание



М = 101/15 + 121/15 + 131/15 + 142/15 + 153/15 + 173/15 + 181/15 + 192/15 + 221/15 = 15,8

Необходимо отметить, что математическое ожидание случайной величины характеризует среднее значение.

5. Вычислить дисперсию

для больших выборок (n >30) ;


для малых выборок (n ≤ 30)

В нашем случае выборка малая n < 30 D = 131,94/14 = 9,42

Дисперсия характеризует разброс, рассеяние случайной величины относительно среднего (математического ожидания).

6. Вычислить среднее квадратическое отклонение ; = 3,07

7. Проверить «правило трёх сигм»

Так называемое «правило трёх сигм» известно в математической статистике как простой прием проверки распределения значений случайной величины на соответствие его нормальному распределению Гаусса. Считается, что если 68,27% от общего количества значений случайной величины (экспериментальных значений в педагогическом исследовании) попадают в полосу (М ± σ), 95,45% – в полосу (М ± ) и 99,73% – в полосу (М ± ), то данное множество экспериментальных данных распределено по нормальному закону (см. рис. 2).



12,73 (15,8 - 3,07) и 18,87 (15,8 + 3;07), в этот интервал попадает 10 значений, это 68% от 15.

Точно так же можно рассчитать, что 95,45% значений при нормальном распределении не выходит за пределы двух стандартных отклонений от средней, и что в пределах трех стандартных отклонений умещается почти все значения 99,73%.

Распределение результатов исследования должно выглядеть следующим образом.


Рисунок 2. Нормальное распределение

Возможны и другие, более точные, процедуры проверки распределения данных относительно нормального распределения, например, с помощью критерия Пирсона, (мода), Мe (медиана), (математическое ожидание выборки). Если Мe, то распределение близко к нормальному.

Метод Стьюдента (нормальное распределение)

Критерием для сравнения средних и вывода о существенности или случайности различия служит нормированное отклонение – коэффициент Стьюдента.



Алгоритм применения

1) вычисляем:



n – объем выборки;

– выборочное среднее (математическое ожидание выборки);

– среднее квадратическое отклонение выборки;

2) сравниваем с М (М – генеральное среднее (математическое ожидание генеральной совокупности);

3) сравниваем выборочное среднее , так называемой экспериментальной группы (группа в которой проводится исследование) с выборочным средним , так называемой контрольной группы, в которой исследование не проводится.

Между средними, как правило, существует различие. Если средние принадлежат одной совокупности, различие случайно. Если средние принадлежат разным совокупностям, различие значимо, оно обусловлено влиянием какого либо фактора.



Алгоритм действий:

1) перед началом исследования с задаваемой вероятностью выдвигаем нулевую гипотезу, предположение о том, что различие между средними носит случайный характер.

2) по таблице 1 коэффициентов Стьюдента (см. Приложение) на основании вероятности и объема выборки () находится (t стандартное);

3) по определенным формулам вычисляется (t фактическое);

4) если , то нулевая гипотеза подтверждается, различие носит случайный характер, средние принадлежат одной совокупности; если > , нулевая гипотеза отвергается, принимается альтернативная гипотеза; различие носит существенный характер, средние принадлежат разным совокупностям.

а) сравниваются с М



,

где ошибка репрезентативности (представительности);



,

где N – объем генеральной совокупности;

если n << N ; если n = N

б) сравниваются (экспериментальная группа) и (контрольная группа)

Для большой выборки n > 30 , где ; ;

Для малой выборки n  30 ,

где и – объемы выборок; и – выборочные средние первой и второй выборок; и – ошибки репрезентативности.

Например, средний вес десятилетних малышей в поселке составлял 28,1 кг, а в следующем году 28 кг, 1 = 3,4 кг, n1 = 600 детей, 2 = 3,8 кг,
n2 = 700 детей. Если ли основание считать, что понижение веса не случайно и отражает какое-либо ухудшение в физическом развитии детей.
Исследование провести с вероятностью Р = 0,95

(по таблице 1 см. Приложение) = 2;

Вывод: < , то нулевая гипотеза подтверждается, различие носит случайный характер и не отражает физического ухудшения здоровья.
1.4. Непараметрические критерии проверки статистических гипотез
Непараметрическими критериями называют те приемы обработки экспериментальных данных, которые не рассматривают анализируемое статистическое распределение как функцию, их применение не предполагает предварительного вычисления параметров распределения. Эти критерии сопоставляют не сами по себе полученные величины, а порядок их расположения, их соотношение по типу больше – меньше.

В большинстве психолого-педагогических исследованиях для оценки существенных различий используют параметрический t – критерий Стьюдента, который основан на предположении, что сравниваемые выборки принадлежат нормальным распределениям совокупностей. Между тем, в психологических исследованиях распределения могут значительно отличаться от нормального. В этих случаях и даже тогда, когда просто неизвестно, являются ли распределения нормальными, применение t – критерия является необоснованным и может привести к ошибочным заключениям. Именно поэтому все большее распространение получают непараметрические критерии различий, не зависящие от формы распределений. Их название связано с тем, что эти критерии не требуют вычисления параметров известных распределений.

Назовем основные преимущества непараметрических критериев:

- при распределениях, близких к нормальному, они дают хороший результат;

- при распределениях, далеких от нормального, позволяют обнаружить существенные различия, когда t – критерий их не выявляет;

- не все психологические признаки распределяются нормально;

- применимость к порядковым, а не строго к количественным показателям;

- рассмотрение качественных признаков, которые выражаются порядковыми номерами или индексами;

- небольшая трудоемкость исследования и относительная простота математического аппарата.

Основные этапы выбора критерия

1. Определить, является ли выборка зависимой или независимой

Две выборки зависят друг от друга, если каждому значению одной выборки можно закономерным и однозначным способом поставить в соответствие ровно одно значение другой выборки. Или связанными называют такие выборки, в которых каждому наблюдению в опыте соответствует свой контроль, т.к. он связан с опытом единством каких-либо условий эксперимента. Например, это исходный уровень измеряемого параметра у того же испытуемого. Если закономерное и однозначное соответствие между выборками невозможно, то выборки являются независимыми. Независимые выборки – это, например, экспериментальная и контрольная.



2. Определить однородность – неоднородность выборки

Основанием для формирования однородной выборки могут служить разные характеристики объекта исследования, такие как уровень обученности, национальность, отсутствие определенных заболеваний и т.д., в зависимости от целей исследования.



3. Оценить объем выборки, и зная ограничения каждого критерия по объему, выбрать соответствующий критерий

При этом целесообразнее всего начинать работу с выбора наименее трудоемкого критерия. Если используемый критерий не выявил различия – следует применить более мощный, но одновременно и более трудоемкий критерий.

При малом объеме выборки следует увеличить величину уровня значимости (не менее 1%), т.к. небольшая выборка и низкий уровень значимости приводят к увеличению вероятности принятия ошибочных решений.

Выбор непараметрического критерия различия зависит от характера нулевой гипотезы, связанности выборок и объема выборки (табл. 2).

Таблица 2. Выбор непараметрического критерия различия


Номер случая

В чем состоит нулевая гипотеза

Связанность выборок

Объем

выборки


Критерии

1

Нет различий в центральных тенденциях распределений

Связанные

(парные)


6-25

G, Т, ТМФ, U

Связанные

26-300

G

Связанные

2-5

ТМФ, U

Независимые

2-10

ТМФ, U

продолжение табл. 2









Независимые

11-20

Q, ТМФ, U

Независимые

21-60

Q, U

Независимые

> 60

Q

2

Нет различий в распределениях

Независимые

2-20

r

Независимые

> 20

U

В табл. 2: критерий G (критерий знаков), критерий Т (Вилкоксона), ТМФ – точный метод Фишера, критерий U (Манна – Уитни), критерий Q (Розенбаума), серийный критерий r (Вальда-Вольфовица) [4].

Рекомендуется применять критерии в порядке их перечисления. Каждый следующий критерий применяется, если предыдущий не выявил различий.



Алгоритм применения непараметрических критериев

Данные. Для исследования нужны однородные объекты, разделенные на две группы. Взаимные влияния и взаимодействия должны быть исключены. Для каждого объекта регистрируется некоторая его числовая характеристика. Возникающие при этом две группы чисел можно рассматривать как две независимые выборки.

Постановка задачи. Какие задачи наиболее часто рассматриваются при сравнении двух выборок? Обычно две выборки получаются как результаты применения различных условий эксперимента к двум группам испытуемых, однородных по своему составу. Изменение условий эксперимента обычно сказывается на изменении положения распределения измеряемой числовой характеристики на числовой прямой. Масштаб и форма распределения при малых изменениях условий эксперимента обычно остаются практически неизменными. При больших изменениях наряду с изменением положения распределения изменяется и его дисперсия. Крайне редко происходит изменение самой формы распределения, поэтому при исследовании различий в двух выборках обычно предполагают, что законы распределения двух анализируемых выборок отличаются только сдвигом и относятся к сдвиговому семейству распределений.

Оценка достоверности сдвига в значениях исследуемого признака

Под сдвигами понимаются достоверные изменения в измеряемых показателях. Сдвиг – это разность между вторым и первым измерениями. Встречаются следующие виды сдвигов:

временные, когда сопоставляются показатели, полученные у одних и тех же испытуемых по одним и тем же методикам, но в разное время (например, проведение повторных контрольных мероприятий);

ситуационные, когда сопоставляются показатели, полученные одним и тем же методом, но в разных условиях измерения (ситуациях);

умозрительный сдвиг, когда сопоставляются показатели в обычных и воображаемых условиях;

структурные, когда сопоставляются разные показатели (вербальные и числовые; ранги и баллы и т.д.) одних и тех же испытуемых.

Во всех этих случаях мы имеем дело о сдвигах под влиянием контролируемых или не контролируемых воздействий. С целью установления сдвигов используют экспериментальные группы (в которых используется экспериментальный, т.е. проверяемый фактор) и контрольные (ЭГ и КГ). Они должны быть «уравновешены» по всем значимым для исследования признакам (полу, возрасту, обученности и т.д.), т.е. стратифицированы и репрезентативны. Следует иметь в виду, что добиться (ЭГ)0 ≈ (КГ)0 , т.е. idem перед экспериментом практически невозможно (здесь: idem – одинаковый).

В ходе эксперимента мы почти никогда не можем быть уверены, что выявленные различия (сдвиги) объясняются только действием исследуемых факторов, а не различиями между двумя выборками.

Когда, например, у одной группы студентов измеряются «начальный уровень обученности», а «остаточные знания» – у другой, то, строго говоря, сравнивать эти результаты нельзя, хотя часто это делается.

В табл. 3 представлена классификация сдвигов и критериев их статистической достоверности.

Таблица 3. Классификация сдвигов и критериев оценки их

статистической достоверности


Виды

сдвигов


Объект

сопоставлений



Условия

Критерии оценки

достоверности сдвига



Кол-во замеров

Кол-во групп

1. Временные, ситуационные, умозрительные, измерительные

Одни и те же показатели, измеренные у одних и тех же испытуемых в разное время, в разных ситуациях, в разных представляемых условиях или разными способами

2


1

G – критерий знаков;

Т – критерий Вилкоксона

3 и более

1

L – критерий тенденций Пейджа;

– критерий Фридмана

2. Сдвиги под влиянием экспериментальных воздействий

Одни и те же показатели, измеренные у одних и тех же испытуемых до и после воздействия:

а) при отсутствии контрольной группы;



2

1

G – критерий знаков;

Т – критерий Вилкоксона


3 и более

1

L – критерий тенденций Пейджа;

– критерий Фридмана

б) при наличии контрольной группы

2

2

Вариант 1 – сопоставление значений «до» и «после» отдельно по экспериментальной и контрольной группам: G – критерий знаков; Т – критерий Вилкоксона.

продолжение табл. 3













Вариант 2 – сопоставление сдвигов в двух группах:

Q – критерий; U – критерий Манна-Уитни; φ* – критерий Фишера







3 и более

2

Сопоставление значений отдельно по экспериментальной и контрольной группам:

L – критерий тенденций Пейджа; – критерий Фридмана.

3. Структурные сдвиги

Разные показатели одних и тех же испытуемых

2

1

G – критерий знаков;

Т – критерий Вилкоксона.

3 и более

1

L – критерий тенденций Пейджа; – критерий Фридмана

Как следует из таблицы, при сопоставлении двух замеров, произведенных на одной и той же (ЭГ) выборке, применяются критерии знаков G и критерий Т Вилкоксона. При сопоставлении трех и более замеров, произведенных на одной и той же выборке, применяются критерий тенденций L Пейджа, а если он неприменим из-за большого объема выборок – критерий Фридмана.

В тех случаях, когда мы хотим оценить различия в интенсивности сдвига в двух группах испытуемых (КГ и ЭГ или двух ЭГ), мы можем использовать различные варианты сопоставлений: 1) производить сопоставления отдельно в двух группах, используя критерии L и ; 2) сопоставлять показатели сдвига в двух группах.

Во второй главе рассмотрим применение непараметрических критериев на примерах.



Каталог: sveden -> files
files -> Анализ методической работы по мкоу лсош №1 им. Люлякина И. М. В 2014-2015 учебном год
files -> Муниципальное бюджетное общеобразовательное учреждение Лицей №6 им
files -> Основы генерал-баса Цель и задачи изучения дисциплины
files -> Генерал-бас Цель и задачи изучения дисциплины Дисциплина «Генерал-бас»
files -> «Школу совершенствовать можно только совершенствуя квалификацию учителя. Каков учитель – такова и школа»
files -> Рабочая программа дисциплины «Педагогика» для оп «44. 03. 01»
files -> Программа внеурочной деятельности начальных классов моу подгоренской сош №1
files -> В. К. Плакаса (2015), Положении о рп фгос
files -> Курс лекций по инженерной геологии яблоновский 2016 Рецензент Щербатова Т. А., канд экон наук, доц., зав каф организации землепользования и экономики филиала фгбоу во «мгту» в пос. Яблоновский Воронцова З. И
files -> История русской литературы ХХ века


Достарыңызбен бөлісу:
  1   2   3   4   5   6   7   8   9   10


©kzref.org 2019
әкімшілігінің қараңыз

    Басты бет