Основні поняття математичної статистики

При аналізі багатьох педагогічних явищ важливу роль відіграють середні величини, які дозволяють глибше зрозуміти особливості об’єкта спостереження. У математичній статистиці є декілька видів середніх величин: середнє арифметичне, медіана, мода і т.ін. Крім того, існує декілька показників коливання (міри розсіювання): варіа-ційний розмах, середнє квадратичне відхилення, середнє абсолютне відхилення, дисперсія тощо.

Середнє арифметичне є абстрактною типовою характеристикою цієї сукупності. Воно згладжує, нівелює випадкові й невипадкові коливання, вплив індивідуальних особливостей та дозволяє подати однією величиною деяку загальну характеристику реальної сукупності одиниць. Середнє арифметичне вираховується як частина від поділу суми величин на їх число і вираховується за формулою:

, (1)

де – середнє арифметичне;

– результати окремих спостережень, значення ознаки;

– кількість спостережень;

– сума результатів усіх спостережень.

Приклад: вирахуємо середнє число годин, які щоденно витра-чаються студентами на самостійну роботу (у вибірці із 20 осіб) (табл. 8.1).

Таблиця 8.1

Витрата часу студентами групи А-2 на самостійну роботу (год.)

 

i
t 2,2 3,2 1,9 3,0 2,8 4,0 1,9 2,3 2,9 3,3 2,0 3,7 1,7 2,4 3,3 1,8 1,7 3,4 3,2 1,9

 

Знаходимо загальну суму часу, який витрачають опитані на самостійну роботу:

год.

За формулою (1) знаходимо:

При обрахуванні середнього арифметичного для згрупованих даних формула (1) має вигляд:

, (2),

де – частота для і-го значення ознаки.

 

Процедура знаходження середнього за згрупованими даними виконується за схемою, яка наведена у табл.8.2.

 

Таблиця 8.2

 

Інтервал Середина інтервалу ( ) Частота (відносна) Добуток
Послідовно записуються усі інтервали
     
 

 

Приклад. Наведені дані щодо щоденної витрати часу на самостійну роботу групою студентів із 20 осіб згрупуємо й продемонструємо у табл. 8.3.

 

Таблиця 8.3

 

Інтервал, год. Середина інтервалу Частота (відносна) Добуток
1 – 2 1,5 10,5
2 – 3 2,5 12,5
3 – 4 3,5
 

 

Звідси вираховуємо:

год.

 

Медіаною називається значення досліджуваної ознаки, зліва і справа від якої знаходиться однакова кількість елементів вибірки за шкалою, побудованою за зростанням чи зменшенням чисел. Місце розташування медіани визначається за формулою:

 

(3)

 

Якщо в ряду парне число членів ( ), то медіана дорівнює середньому арифметичному з двох серединних значень ознаки; при непарному числі членів ( ) медіанним буде значення ознаки у ( ) об’єкта.

Наприклад, у вибірці з 10 осіб респонденти проранжовані за пе-дагогічним стажем роботи на кафедрі (табл. 8.4).

Таблиця 8.4

 

Дані щодо педагогічного стажу викладачів кафедри

 

Ранг викладача
Педагогічний стаж

 

Знаходимо місце медіани: (серединні значення 5 і 6).

Звідси медіана дорівнює:

За результатами визначення медіани можна зробити висновок, що більше половини викладачів кафедри мають стаж 6,5 років.

Варто додати, що:

- медіана ділить впорядкований варіаційний ряд на дві рівні по чисельності групи;

- квартилі ділять ряд розподілу на 4 рівні частини;

- процентилі ділять множину на 100 частин з рівним числом спостережень у кожній;

- децилі ділять множину спостережень на 10 рівних частин;

Квантилі (квартилі, процентилі, децилі) легко вираховуються за розподілом накопичених частот.

Модоюу статистиці називають значення ознаки, яке найчастіше зустрічається і з яким найбільш вірогідно можна зустрітися в серії зареєстрованих спостережень. Іншими словами, – це типове значення ознаки, яке найчастіше зустрічається серед інших значень. Мода від-повідає класу з максимальною частотою. Цей клас називають модальним значенням.

У дискретному ряді мода ( ) – це значення з найбільшою частотою. В інтервальному ряді (з рівними інтервалами) модальним є клас з найбільшим числом спостережень. При цьому значення моди знаходиться в його межах і вираховується за формулою:

, (4)

де – нижня границя (межа) модального інтервалу;

– величина інтервалу;

– частота інтервалу, який знаходиться попереду;

– частота інтервалу, наступного за модальним;

– частота модального класу.

 

Приклад. На питання анкети: «Вкажіть ступінь володіння іно-земною мовою» відповіді 598 студентів першого курсу інженерних спеціальностей були такими:

- володію вільно – 31;

- володію достатньо для спілкування – 60;

- володію, але відчуваю труднощі при спілкуванні – 278;

- розумію важко – 195;

- не володію – 34.

Цілком очевидно, що типовим значенням у наведеному прикладі є «володію, але відчуваю труднощі при спілкуванні», яке і буде модальним. Таким чином, мода дорівнює 278.

До основних недоліків моди як виду середніх величин варто віднести:

- неможливість виконувати над модою алгебраїчні дії;

- залежність її величини від інтервалу групування;

- можливість існування в ряді розподілу декількох модальних значень ознаки.

Для характеристики рядів розподілу є недостатнім мати лише середні величини даної ознаки, бо два ряди, наприклад, можуть мати однакові середні арифметичні, але ступінь концентрації (чи «розки-дання») значень ознак навкруг середньої буде зовсім іншим. Характе-ристикою такого розкидання є показники розсіювання – дисперсія, середнє квадратичне відхилення, коефіцієнт варіації.

Дисперсієюназивають величину, рівну середньому значенню квад-рата відхилень окремих значень ознак від середньої арифметичної.

Дисперсія вираховується за формулою:

(5)

 

Послідовність вирахування дисперсії така:

- визначення відхилення від середнього значення;

- вирахування квадрата зазначеного відхилення;

- знаходження суми квадратів відхилення і середнього значення квадрата відхилень (табл. 5).

 

Приклад. За результатами виконання контрольної роботи сту-денти групи отримали такі оцінки: «відмінно» – 4 особи; «добре» – 8 осіб; «задовільно» – 5 осіб; «незадовільно» – 5 осіб. Для вирахування дисперсії оцінок студентів слід скласти таблицю (табл. 8.5).

 

Таблиця 8.5

№ п/п Оцінка Відхилення від середнього Квадрат відхилення
-1,5 2,25
1,5 2,25
-0,5 0,25
0,5 0,25
-1,5 2,25
0,5 0,25
1,5 2,25
-0,5 0,25
0,5 0,25
0,5 0,25
-1,5 2,25
0,5 0,25
-0,5 0,25
1,5 2,25
0,5 0,25
-1,5 2,25
0,5 0,25
-0,5 0,25
0,5 0,25
1,5 2,25
-0,5 0,25
-1,5 2,25

 

Цілком очевидно, що величина дисперсії не дозволяє спосте-рігачеві безпосередньо зробити певні узагальнення щодо розкиду досліджуваної змінної. Величиною, яка безпосередньо пов’язана зі змістовими характеристиками змінної, є середнє квадратичне відхилення. Середнє квадратичне відхилення підтверджує типовість і показовість середньої арифметичної та відображає міру коливання числових значень ознаки. Воно дорівнює кореню квадратному із дисперсії та визначається за формулою:

, (6)

де – дисперсія.

 

У попередньому прикладі щодо результатів виконання студентами контрольної роботи дисперсія дорівнює 1,27. Тоді середнє квадратичне відхилення буде:

.

 

Отримані дані можна інтерпретувати таким чином: при середній оцінці 3,5 виконання контрольної роботи всі інші студенти групи мають оцінку, яка в середньому відхиляється від 3,5 на 1,13.

Середнє квадратичне відхилення є мірою абсолютного коливання ознаки і завжди виражається у тих самих одиницях вимірювання, що й ознака. Це не дозволяє зіставити між собою середні відхилення різних ознак, а також однієї й тієї ж ознаки у різних сукупностях. Щоб мати таку можливість, слід середні відхилення виразити у від-сотках до середнього арифметичного – у вигляді відносних величин. Відношення середнього квадратичного відхилення до середнього арифметичного називають коефіцієнтом варіації ( ):

(7)

Природно, з двох порівнювальних рядів той має більший розкид, у якого коефіцієнт варіації більший.

 








Дата добавления: 2015-11-06; просмотров: 1302;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.022 сек.