Лекция 4

Тема 4. МАТЕМАТИКО-СТАТИСТИЧЕСКАЯ ОБРАБОТКА МАТЕРИАЛОВ НАУЧНОЙ И МЕТОДИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ

4.1. Основные виды измерительных шкал

Проведение любых исследований, в том числе и в области физического воспитания и спорта, связано с определенными измерениями. Измерение в самом широком смысле может быть определено как приписывание чисел к объектам или событиям согласно некоторым правилам. Эти правила должны устанавливать соответствие между свойствами рассматриваемых объектов и чисел, что порождает четыре основных вида таких шкал: наименований, порядка, интервальная и отношений. Измерения, осуществляемые с помощью двух первых шкал, считаются качественными, двух последних – количественными. В каждой шкале строго определены свойства чисел, которые приписываются объектам. При этом чем выше порядок шкалы, тем больше арифметических действий разрешается проводить над числами, приписанными объектам.

 

4.1.1. Шкала наименований

Построение этой шкалы основано на группировке объектов, явлений в соответствующие классы в зависимости от проявления у них определенных признаков или свойств. Всем объектам или явлениям, попавшим в один и тот же класс, группу, приписывается одно и то же число, объектам и явлениям другого класса – другое число. Например, всех студентов факультета в зависимости от того, в каком виде спорта они специализируются, можно подразделить на следующие классы: баскетболисты, волейболисты, гимнасты, футболисты, лыжники, легкоатлеты и т. д. В данном случае классу баскетболистов можно приписать цифру 1; волейболистов – 2; гимнастов – 3; футболистов – 4; лыжников – 5; легкоатлетов – 6 и т. д. В результате все студенты факультета будут отнесены к тому или иному классу, группе специализаций. Таким же образом можно подразделить студентов или других занимающихся на определенные классы в зависимости от пола, возраста, разряда, принадлежности к тому или иному спортивному клубу и т.п. Необходимым и достаточным условием для применения шкалы наименований является наличие такого критерия, пользуясь которым исследователь может однозначно отличить один объект, который имеет необходимый признак или свойство, от другого, который его не имеет.

Измерения, производимые по шкале наименований, допускают несколько статистических операций. Прежде всего это подсчет числа объектов в каждом классе и выявление простого или процентного отношения этого числа к общему числу рассматриваемых объектов. На основе полученных результатов можно выделить класс с наибольшим числом объектов (наибольшей абсолютной частотой), который принято называть модой. Несмотря на определенную примитивность шкалы наименований, измерения по этой шкале могут быть использованы для проверки некоторых статистических гипотез и для вычисления показателей корреляции качественных признаков.

 

4.1.2. Шкала порядка

Порядковые измерения (ранжирование) возможны тогда, когда измеряющий может обнаружить в объектах или явлениях различие степеней признака или свойства и на этой основе расположить эти объекты в порядке возрастания или убывания величины рассматриваемого признака. Каждому объекту или явлению в этом случае приписывается порядковое число, обозначающее его место в данном ряду. Это число называют рангом.

Ранговые числа подбираются так, чтобы объектам с большей величиной изучаемого признака приписывались числа большие, чем у объектов с меньшей величиной этого признака. Примерами измерения на основе шкалы порядка могут служить военные ранги от рядового и выше, ранжирование по силе нервной системы (слабый тип, сильный тип) или, например, распределение студентов факультета в зависимости от того или иного спортивного разряда по возрастающему порядку – от III разряда до звания мастера спорта. Поскольку шкала порядка устанавливает только отношение равенства и порядка, для приписывания объектам могут быть использованы любые цифры, которые можно расположить в порядке возрастания (убывания) измеряемого свойства. В связи с этим для нашего примера с целью обозначения порядка разрядов могут использоваться любые цифры, представляющие монотонно возрастающую последовательность. Например, III разряд – 1, II – 2, I – 3, КМС – 4, МС – 5 или другие цифры, расположенные в порядке возрастания, – 5, 13, 17, 15, 26. Пользуясь шкалой порядка, можно выяснить положение изучаемого объекта в рассматриваемом ряду, но нельзя определить величину интервалов, на которые разбит этот ряд. Поэтому с этими числами (баллами, рангами), приписываемыми объектам, так же как и в шкале наименований, нельзя производить арифметические действия (складывать, вычитать, умножать, делить).

 

4.1.3. Интервальная шкала

Типичными примерами измерений по шкале интервалов являются измерения календарного времени (летосчисление, счет дней в году, недель, месяцев, текущего времени, температуры по шкале Цельсия и т. п.)- Важная особенность, отличающая интервальное измерение от измерения по шкале отношений, с которой вы ознакомитесь ниже, состоит в том, что оцениваемое свойство предмета или явления вовсе не пропадает, когда результат измерения равен нулю. Так, вода при температуре 0°С имеет определенную температуру. Нулевая точка (начало отсчета) на интервальной шкале в некоторой степени произвольна, условна, неабсолютна. Например, современное летосчисление осуществляется по интервальной шкале. Но год первый был выбран произвольно. Единицей измерения является период 365 дней. Можно сказать, что 1970 г. ближе к настоящему времени, чем любой другой с меньшим номером. Можно также точно сказать, на сколько один период времени больше или меньше другого. Так, период времени (1968–1970) меньше, чем период (1972–1978), на четыре года. Однако в отличие от естественных и технических наук в социальных науках (в том числе и педагогических) в настоящее время специально разработанных шкал интервального типа почти нет.

 

4.1.4. Шкала отношений

Измерение по шкале отношений отличается от такового по интервальной шкале тем, что нулевая точка здесь не произвольна, а указывает на полное отсутствие измеряемого свойства. Поэтому шкала отношений позволяет определить не только, на сколько больше (меньше) один объект от другого в отношении измеряемого свойства, но и во сколько раз (в два, три и т.д.) больше (меньше). Например, мастер спорта берет высоту 2 м, а ученик четвертого класса преодолевает планку лишь на высоте j м; Можно сказать, что мастер спорта прыгает выше ученика на 1 м. Для осуществления измерений по шкале отношений используются метрические системы оценок, примерами которых могут быть измерения длины, высоты в принятых единицах (например, измерения роста спортсменов, дальности метания снарядов, длины и высоты прыжков и т. п.), веса (измерение веса учеников, снарядов, усилий с помощью динамометров и т.д.), времени выполнения определенных действий (продолжительность бега, продолжительность выполнения гимнастической комбинации, измерение времени двигательной реакции и т.п.), угловые перемещения в градусах, число попаданий в цель, число подтягиваний и т. п.

Анализ измерительных шкал показывает, что для обработки результатов исследований в области физического воспитания и спорта при определенных условиях могут использоваться все разновидности этих шкал. При этом выбор той или иной из них зависит от того, что и как измеряется. В свою очередь характер измерений, т. е. на основе какой шкалы они сделаны, оказывает влияние на методику обработки полученных результатов с применением параметрических (в случае количественных измерений по интервальной шкале и шкале отношений) или непараметрических (в случае использования для этой цели шкалы наименований и порядка) критериев.

 

4.2. Способы вычисления достоверности различий между двумя независимыми результатами

В большинстве случаев в исследованиях студентов, выполняющих дипломные работы, могут решаться задачи выявления эффективности той или иной методики обучения и тренировки с применением определенных средств, приемов и способов организации занятий. Эти задачи обычно решаются путем проведения сравнительного педагогического эксперимента с выделением экспериментальных и контрольных групп, результаты которых в теории статистики принято называть независимыми [3, 4, 6]. В слу-

чае, когда мы имеем дело с результатами, полученными в начале и в конце или на разных этапах проведения эксперимента в одной и той же группе (например, при проведении абсолютного эксперимента), эти результаты считаются зависимыми. Однако здесь мы ограничимся рассмотрением методики обработки только независимых результатов. В подобных случаях исследователю прежде всего необходимо ответить на вопрос: оказалась ли эффективной применяемая экспериментальная методика? С этой целью рассчитывается достоверность различий между полученными в итоге проведения сравнительного педагогического эксперимента результатами экспериментальных и контрольных групп. В педагогических исследованиях различия считаются достоверными при 5%-ном уровне значимости, т. е. при утверждении того или иного положения допускается ошибка не более чем в 5 случаях из 100.

 

 

4.2.1. Определение достоверности различий по t-критерию Стьюдента

t-Критерий Стьюдента относится к параметрическим, следовательно, его использование возможно только в том случае, когда результаты эксперимента представлены в виде измерений по двум последним шкалам – интервальной и отношений. Проиллюстрируем возможности критерия Стьюдента на конкретном примере.

Предположим, вам необходимо выяснить эффективность обучения стрельбе по определенной методике. С этой целью проводится сравнительный педагогический эксперимент, где одна группа (экспериментальная), состоящая из 8 человек, занимается по предлагаемой экспериментальной методике, а другая (контрольная) – по традиционной, общепринятой. Рабочая гипотеза заключается в том, что новая, предлагаемая вами методика окажется более эффективной. Итогом эксперимента является контрольная стрельба из пяти выстрелов, по результатам которых (табл. 6) нужно рассчитать достоверность различий и проверить правильность выдвинутой гипотезы.

Таблица   6

Сравнительные результаты обучения стрельбе

Группы

п

Очки

Экспериментальная

8

35

40

28

32

30

25

43

44

Контрольная

8

23

20

43

35

15

26

24

28

Что же необходимо сделать для расчета достоверности различий по t-критерию Стьюдента?

1. Вычислить средние арифметические величины X для каждой группы в отдельности по следующей формуле:

где X. – значение отдельного измерения; п – общее число измерений в группе.

 

4.2.2. Определение достоверности различий по Т-критерию Уайта

Одним из критериев, применяемых для установления достоверности различий, наблюдаемых при сравнении двух независимых результатов, полученных по шкале порядка, является непараметрический Г-критерий Уайта, который в равной мере применим для сравнения трупп с одинаковым числом испытуемых и с неодинаковым. Сущность методики определения достоверности различий на основе этого критерия следующая. Результаты экспериментальных и контрольных групп ранжируют (упорядочивают) в общий ряд и находят их ранги. Затем эти ранги суммируют отдельно для каждой группы. Если сравниваемые результаты этих групп совершенно не отличаются один от другого, то эти суммы их рангов должны быть равны между собой, и наоборот. Чем значительнее расхождение между полученными результатами, тем больше разница между суммами их рангов. Достоверность этих различий и оценивается с помощью Т-критерия Уайта по специальной таблице. Необходимо указать, что данная таблица 8 пригодна в случае, когда максимальное число испытуемых в одной группе не превышает 27, а в другой – 15. При равновеликих группах число испытуемых в каждой из них не должно превышать 15. Для оценки критерия Т всегда берется меньшая из двух сумм рангов, которая и сравнивается с табличным (стандартным) значением этого критерия для пэ и nк, т. е. числа испытуемых в экспериментальной и контрольной группе. Если Гст (табличное) > Тф (меньшая сумма рангов), это указывает на достоверность различий. Если же табличное число (Тст) меньше или равно фактической величине критерия ф), разница считается статистически недостоверной. Покажем определение достоверности различий с помощью Т-критерия Уайта на конкретном примере, где задачей исследования является определение эффективности обучения гимнастическим упражнениям по методике предписаний алгоритмического типа (экспериментальная группа) и целостной методике (контрольная группа).

 

4.2.3. Определение достоверности различий по критерию 2

Критерий  (хи-квадрат) применяется для сравнения распределений испытуемых двух групп по состоянию некоторого свойства на основе измерений по шкале наименований. Для расчета достоверности различий результаты, полученные в обеих группах, распределяются в четырехпольные или многопольные «таблицы» в зависимости от того, на сколько классов (категорий) эти результаты подразделяются.

Случай четырехпольной «таблицы». Допустим, проверяется эффективность использования специальной методики обучения подъему разгибом на перекладине. Отберем для этой цели две равноценные группы по 25 чел. в каждой: экспериментальную, в которой обучение ведется по экспериментальной методике, и контрольную, в которой обучение проводится по общепринятой, традиционной, методике. Результаты обучения будем измерять по шкале наименований, имеющей только две взаимоисключающие категории: выполнил – не выполнил. На основе таких измерений результатов обучения занимающихся в экспериментальной и контрольной группах составляется четырехпольная «таблица» 2x2:

 

 

Категория 1

Категория 2

 

Экспериментальная группа

Э1

Э2

Э, + Э2=пэ

Контрольная группа

К1

К2

К1 + К2=пк

 

Э11

Э22

Nэ+nk=N

 

В этой «таблице» Э1 – число занимающихся в экспериментальной группе, попавших в первую категорию (класс), например в категорию выполнивших подъем разгибом; Э2 – число занимающихся в экспериментальной группе, попавших во вторую категорию, например в категорию не выполнивших подъем разгибом; соответственно К1 и К2; N – общее число наблюдаемых (испытуемых), равное Э1 + Э2+ К1 + К2, или пэ+ пк. На основе данных такой «таблицы» можно проверить гипотезу о равенстве вероятностей попадания занимающихся в экспериментальной и контрольной группах в первую (вторую) категорию шкалы измерения проверяемого свойства, например гипотезу о равенстве вероятностей выполнения подъема разгибом занимающимися в экспериментальной и контрольной группах, и на этой основе судить об эффективности той или иной методики обучения. Для проверки гипотезы подсчитывается значение хи-квадрат по следующей формуле:

 

4.3. Определение меры связи между явлениями

Исследователей часто интересует вопрос о том, как связаны между собой различные факторы, влияющие на результаты учебно-тренировочного процесса. Например, имеют ли спортсмены, начавшие заниматься каким-либо видом спорта в более раннем возрасте, тенденцию к достижению более высоких результатов? Или как влияет гибкость гимнаста на качество выступлений на соревнованиях и т. п. Такого рода связи и зависимости называются корреляционными или просто корреляцией. Изучение этих связей с помощью математических методов осуществляется на основе корреляционного анализа, основные задачи которого – измерение тесноты, а также определение формы и направления существующей между рассматриваемыми явлениями и факторами зависимости. По направлению корреляция бывает положительной (прямой) или отрицательной (обратной), а по форме – линейной и нелинейной. При положительной корреляции с возрастанием признаков одного фактора они увеличиваются и у другого. Например, с увеличением силовых показателей у штангистов улучшаются их результаты на соревнованиях. При отрицательной корреляции наоборот – при увеличении признаков одного фактора признаки другого уменьшаются. Например, увеличение веса у гимнасток может вызвать ухудшение спортивных результатов. Корреляция называется линейной, когда направление связи между изучаемыми признаками графически и аналитически выражается прямой линией. Если же корреляционная зависимость имеет иное направление, она называется нелинейной. Анализ линейной корреляции осуществляется с помощью вычисления коэффициентов корреляций (г). Для измерения криволинейной, т. е. нелинейной, зависимости используется показатель, называемый корреляционным отношением. Здесь мы рассмотрим только линейную корреляцию, с анализом которой в исследованиях в области физического воспитания и спорта приходится сталкиваться наиболее часто. При наличии положительной связи между изучаемыми признаками величина коэффициента корреляции имеет положительный знак (+), а при отрицательной – знак (–). Величина этого коэффициента может колебаться от –1 до +1. Если коэффициент корреляции меньше 0,3, считается, что связь слабая, при коэффициенте от 0,31 до 0,69 – средняя и при значениях коэффициента от 0,70 до 0,99 – сильная. Значение коэффициента корреляции выражается десятичными дробями с точностью до второго знака после запятой. Для изучения меры связи при линейной корреляции в зависимости от того, по какой шкале произведены измерения, вычисляется тот или иной вид коэффициента.

 

4.3.1. Определение коэффициента корреляции при оценке качественных признаков

Когда признаки, свойства, параметры и т. п. не поддаются количественному измерению и не распределяются в вариационный ряд, т. е. тогда, когда мы пользуемся шкалой наименований, корреляция между ними устанавливается по наличию этих признаков. В случае, когда анализируется связь только между двумя качественными признаками, прибегают к вычислению коэффициента ассоциации (га). При этом данные о наличии или отсутствии каждого признака группируются в четырехпольную корреляционную «таблицу»:

 

 

есть

нет

 

1-й признак

а

б

а + б =15

2-й признак

в

г

в + г = 15

 

а + в

б + г

N= 30

Коэффициент ассоциации вычисляется по следующей формуле:

где а, б, в, г – численности альтернативных признаков, расположенные в клетках корреляционной «таблицы». Одним из условий правильного применения коэффициента ассоциации является требование, чтобы ни одна из частот четырехпольной «таблицы» не была меньше 5. Для того чтобы легче понять методику расчета коэффициента ассоциации, снова обратимся к примеру.

Допустим, вы хотите изучить связь между чрезмерно строгой дисциплиной в семье и проявлением упрямства и непослушания у занимающихся в отделении ДЮСШ. Результаты наблюдений внесем в четырехпольную корреляционную «таблицу»:

 

 

Есть

Нет

 

1. Упрямство

а = 7

6 = 8

а + б=15

2. Строгая дисциплина

в = 5

г = 10

в + г=15

 

а + в=12

б + г=18

N=30

Подставим эти значения в формулу и рассчитаем коэффициент ассоциации:

Значение полученного коэффициента показывает, что между строгой дисциплиной в семье и проявлением у занимающихся упрямства и непослушания обнаруживается слабая положительная связь. Однако прежде чем делать окончательные выводы, необходимо проверить достоверность этого коэффициента: не является ли эта величина случайной. Проверка достоверности в данном случае осуществляется следующим образом. Если величина  превосходит указанное в таблице критическое значение для принятого уровня значимости и числа степеней свободы (K=N–2), то наличие связи считается достоверным, и наоборот.

В нашем примереТеперь по таблице (приложение 11) найдем значение коэффициента корреляции при р = 0,05 и числе степеней свободы

Это значение равно 0,36. Вычислим величину  Произведенный расчет показывает, что   Следовательно, обнаруженная положительная связь между чрезмерно строгой дисциплиной в семье и проявлениями упрямства и непослушания у детей считается недостоверной rа = 0,136 при р > 0,05). Очевидно, при увеличении числа наблюдений наличие такой связи может оказаться достоверным.

 

4.3.2. Определение коэффициента ранговой корреляции

Наиболее известным показателем связи является коэффициент ранговой корреляции Спирмена – мера зависимости двух случайных признаков Х и Y, основанная на ранжировании независимых результатов наблюдений {, Y{), ..., п, Y„). Он определяется по формуле:

где d-, – разность между рангами Xh Yr

Чтобы выяснить, существует ли связь между двумя признаками (свойствами), нужно ранжировать их значения и посмотреть, как они располагаются по отношению друг к другу. Если возрастающим значениям одного признака соответствуют однохарактерные значения другого признака, то между ними налицо положительная связь. В случае когда при возрастании одного признака значения другого последовательно убывают, то это свидетельствует о наличии отрицательной связи между ними. При ранговой корреляции сравнивают не сами значения измерений или числа измерений, а только порядок (ранги), поэтому вычисление рангового коэффициента возможно только тогда, когда результаты измерений получены на основе шкалы не ниже порядковой [1, 2]. Например, баллы или другие условные единицы измерения. Ранговый коэффициент не рекомендуется применять, если связанных пар меньше 5 и больше 20. Технику вычисления рангового коэффициента легко усвоить на конкретном примере. Допустим, что мы из двух рядов измерений получим следующие значения:

 

Испытуемые:

1

2

3

4

5

6

7

8

9

10

Признак А

200

158

170

108

198

128

194

162

148

138

Признак Б

180

90

97

62

104

95

120

ПО

87

100

 

 

 

Таблица   9

Определение коэффициента ранговой коррекции

 

Испытуемые

Ряды измерений

Ранговые числа

Разность файлов

А

Б

А,

Б,

d=ArB]

d2

А

200

180

1

1

0

0

Б

198

104

2

5

-3

9

Ж

194

120

3

2

1

1

В

170

97

4

6

-2

4

З

162

110

5

3,5

1,5

2,25

Д

158

90

6

8

-2

4

И

148

87

7

9

-2

4

К

138

110

8

3,5

4,5

20,25

Е

128

95

9

7

2

4

Г

108

62

10

10

0

0

п = 10

 

 

 

 

2

Σd2 = 48,5

 

Для того чтобы вычислить ранговый коэффициент по приведенной выше формуле, вначале необходимо произвести предварительные расчеты (табл. 9).

Порядок вычисления необходимых данных таков:

1.Произвести ранжирование показателей признака А в убывающем (возрастающем) порядке и расставить испытуемых в порядке убывания (возрастания) признака А – 1, 2-я колонки таблицы.

2.Рядом со значениями признака А для каждого испытуемого проставить значения показателей признака Б – 3-я колонка таблицы.

3.По каждому признаку проставить ранговые числа. При этом когда попадаются одинаковые значения, например ПО и ПО по признаку Б, в этом случае общим для обоих значений будет среднеарифметический ранг – 3,5 – 4 и 5-я колонки таблицы.

4.Вычислить разность рангов (d = А1 – Бс сохранением соответствующего знака – 6-я колонка.

5.Возвести разность рангов в квадрат (d2) – 7-я колонка.

6.Вычислить сумму квадратов разности рангов ().

7.Полученные таким образом значения подставить в известную формулу и вычислить коэффициент ранговой корреляции:

Вычисленное значение коэффициентов ранговой корреляции в данном случае свидетельствует о наличии сильной положительной связи между признаками А и Б. Однако необходимо проверить, насколько достоверно значение рассчитанного нами коэффициента корреляции. Для этого сравним его с критическим значением. Если вычисленный коэффициент ранговой корреляции превышает значение критического (rs фак > rs крит), то наличие связи считается достоверным, и наоборот. По таблице (приложение 12), в которой приведены критические значения rs для различных чисел парных наблюдений (и) и двух уровней значимости (s = 0,05 и 5 = 0,01), находим критическое значение для п = 10. Оно равно 0,564 при уровне значимости 0,05 и 0,746 – при уровне значимости 0,01. Стало быть, вычисленный нами коэффициент превышает критическое значение при уровне значимости 0,05 (0,707 > 0,564). Следовательно, проявление связи между признаками А и Б можно считать достоверным (г, = 0,707 при s < 0,05).

 

4.3.3. Определение коэффициента корреляции при количественных измерениях

Когда результаты получены на основе шкалы интервалов и отношений, корреляционный анализ целесообразнее проводить с помощью вычисления коэффициента корреляции (г), рассчитанного для количественных измерений по следующей формуле:

где Хi – отдельные значения первого признака; средняя арифметическая величина первого признака; Yiотдельные значения второго признака;  – средняя арифметическая величина второго признака.

 

4.4. Меры центральной тенденции (средние величины)

Одной из важнейших обобщающих характеристик варьирующих признаков является средняя величина. Значение средних заключается в их свойстве нивелировать индивидуальные различия, в результате чего выступает более или менее устойчивая числовая характеристика признака – не отдельных измерений, а целой группы статистических единиц. Средняя величина характеризует групповые свойства, является центром распределения, занимает центральное положение в общей массе варьирующих значений признака [4, 6, 7]. Существует несколько видов средних величин. Наиболее часто в педагогических исследованиях используются такие средние, как мода, медиана и средняя арифметическая величина. Первые два вида – непараметрические, а средняя арифметическая представляет собой параметрическую величину. Вы можете спросить, зачем нужны все эти меры центральной тенденции? Во-первых, каждая мера центральной тенденции обладает характеристиками, которые делают ее ценной в определенных условиях. Во-вторых, вычисление той или иной меры связано со шкалой измерения. В-третьих, каждая мера центральной тенденции служит основой для вычисления других статистических величин.

 

4.4.1. Методика определения моды

Мода (Мо), как уже говорилось ранее, это такое значение в множестве наблюдений, которое встречается наиболее часто. Например, в ряду из цифр: 2, 6, 8, 9, 9, 9, 10 модой является 9, потому что она встречается чаще любого другого значения. Обратите внимание, что мода представляет собой наиболее частое значение (в данном примере 9), а не частоту этого значения (в примере равную 3). Мода, как мера центральной тенденции, имеет определенные особенности, которые необходимо учитывать при ее вычислении (определении).

1.В случае когда все значения в группе встречаются одинаково часто, принято считать, что группа не имеет моды. Например, 6 легкоатлетов пробежали дистанцию 100 м и показали результаты: 12, 12, 13, 13, 11, 11, 10, 10 с. В данном случае моду обнаружить невозможно.

2.Когда два соседних значения имеют одинаковую частоту и они больше частоты любого другого значения, мода есть среднее этих двух значений. Например, 10 гимнастов за упражнения на коне получают следующие оценки: 6,9; 7,0; 7,5; 8.0: 8.0: 8.0: 9.0: 9.0: 9.0: 8,5. В этом случае мода будет равна 8,5.

3.Если два несмежных значения в группе имеют равные частоты и они больше частот любого значения, то существуют две моды. Например, в группе значений: 9, 10. 10. 10. 13, 15, 16. 16. 16. 17 модами являются 10 и 16. В этом случае можно говорить, что данные бимодальны. Значение моды можно определить фактически при любом способе измерений, сделанных на основе всех шкал измерения. Однако наибольшее применение она находит в измерениях по шкале наименований, так как другие меры центральной тенденции к таким измерениям неприменимы.

 

4.4.2. Методика определения медианы

Медиана (Md) – это такое значение, которое делит упорядоченное множество пополам так, что одна половина значений оказывается больше медианы, а другая – меньше. Определение медианы возможно лишь в том случае, когда измерения выполнены не ниже шкалы порядка. Способы вычисления медианы могут быть следующие.

1.Если данные содержат нечетное число различных значений и они представляют упорядоченный ряд, то медианой является среднее значение ряда. Например, в ряду 5, 8, 12, 25, 30 медиана равна 12.

2.Если данные содержат четное число различных значений, упорядоченных в ряд, например 3, 8, 16, 17, то медианой являет-

ся точка, лежащая посередине между двумя центральными значениями: Md = (8 + 16): 2 = 12.

3. Для более точного определения медианы можно воспользоваться специальной формулой. Но прежде чем привести эту формулу, ознакомимся с некоторыми дополнительными понятиями, знание которых при этом необходимо:

класс – группы одинаковых чисел в данном ряду;

медианный класс – класс, в котором находится медиана;

классовый промежуток – разность между числами соседних классов;

частота класса – количество одинаковых чисел в классе;

частота медианного класса – количество одинаковых чисел в медианном классе. Закрепим эти понятия на конкретном примере. Допустим, что на экзаменах по легкой атлетике студенты получили следующие оценки: 4, 3, 2, 4, 3, 3, 5, 3, 3, 4, 4, 3, 5, 4, 2, 5, 3, 3, 4, 2, 2, 4; расположим эти оценки в порядке возрастания: 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5. Этот ряд подразделяется на четыре класса: «2», «3», «4», «5». Медианным классом является класс «3», классовый промежуток в этом ряду равен 1, частота класса «2» – 4 (т. е. оценка 2 встречается 4 раза); класса «3» – 8; класса «4» – 7; класса «5» – 4. Если определять медиану простыми способами, то и она будет равняться 3, двенадцатое значение, которое занимает центральное положение в ряду из 23 данных (значение медианы подчеркнуто). Однако довольно приблизительное значение, определяемое этими способами, иногда может не удовлетворить исследователя. Поэтому ее можно вычислить по следующей формуле:

где Wначало класса, в котором находится медиана; п – общее число данных; К– величина классового промежутка;Z– сумма частот классов, предшествующих медианному классу;/– частота медианного класса.

Составим для приведенного выше ряда таблицу частот каждой оценки.

 

Оценка

Частота оценок

2

4

3

8

4

7

5

4

Итого

23

Используя данные таблицы W= 3; К= 1; п = 23; Z = 4;/= 8, вычислим значение медианы по предлагаемой формуле: