Соціологія: пер. с англ.

Автор: | Рік видання: 1999 | Видавець: Київ: Основи | Кількість сторінок: 726

ДОДАТОК 1: СТАТИСТИЧНІ ТЕРМІНИ

У соціологічних дослідженнях для аналізу результатів часто використовують статистичні методи. Деякі з цих методів дуже заплутані й складні, однак ті, що використовуються найчастіше, легко зрозуміти. Найпоширенішими є показники головної тенденції (способи підрахунку середніх) та коефіцієнти кореляції (показники міри, до якої одна змінна постійно співвідноситься з іншою).

Існують три методи розрахунку середніх чисел, кожен з яких має певні переваги та вади. Для прикладу візьмемо суму особистого багатства (включаючи всі активи, такі як будинки, автомобілі, банківські рахунки та інвестиції) тринадцятьох осіб. Припустімо, що цим людям належать такі суми (у фунтах стерлінгів):

1. ООО (нуль) 6. 40 000 10. 150 000

2. 5000 7. 40 000 11. 200 000

3. 10 000 8. 80 000 12. 400 000

4. 20 000 9. 100 000 13. 10 000 000

5. 40 000

Середній показник — це число, яке ми одержуємо, склавши разом особисте багатство усіх 13 осіб і поділивши результат на 13. Загальна сума становить 11 085 000 фунтів стерлінгів; поділивши це число на 13, ми одержимо середню суму 852 692.31. Цей спосіб підрахунку часто доцільний, оскільки ґрунтується на всьому діапазоні наявних даних. Утім, якщо один або кілька випадків дуже різняться від більшості випадків, він може ввести в оману. У наведеному вище прикладі середня сума насправді не є відповідним показником головної тенденції, бо одна, дуже велика сума (10 мільйонів фунтів стерлінгів) викривлює всю картину. Тому хтось може зробити висновок, що більшість людей мають вищий, ніж насправді, рівень достатку.

У таких випадках можна скористатися одним з двох інших показників. Мода — це число, яке найчастіше зустрічається у певному переліку даних. У нашому прикладі це 40 000. Проблема полягає в тому, що в значенні моди не враховується сукупний розподіл даних, тобто діапазон задіяних чисел. Найчастіший випадок у переліку цифр необов'язково репрезентує їх розподіл загалом, а тому може не бути відповідним середнім показником. У цьому випадку сума 40 000 надто наближена до нижнього краю цифр.

Третім показником виміру є медіана, котра знаходиться посередині будь-якого переліку цифр; тут це буде сьоме число — 40 000. У нашому прикладі непарне число цифр — 13. За наявності парного числа, наприклад 12, медіану можна було б обрахувати, взявши середнє значення двох середніх прикладів — цифр 6 і 7. Як і мода, медіана не дає уявлення про фактичний діапазон вимірюваних даних.

Іноді дослідник може користуватися більше ніж одним показником головної тенденції, аби уникнути оманливого середнього показника. Частіше він (вона) підраховуватиме нормативне відхилення потрібних даних. Це спосіб розрахунку ступеня дисперсії, або діапазону переліку цифр; у нашому випадку він простягається від нуля до 10 000 000.

Коефіцієнти кореляції надають корисний спосіб вираження близькості поєднання двох (чи більше) змінних. Якщо дві змінні корелюються повністю, ми можемо говорити про абсолютне позитивне співвідношення, що виражається числом 1,0. Якщо між двома змінними не існує жодної кореляції, тобто вони не мають ніякого послідовного взаємозв'язку, то коефіцієнт дорівнює нулю. Абсолютне негативне співвідношення, що виражається як -1,0, виникає тоді, коли дві змінні перебувають у цілком зворотному зв'язку. У суспільних науках абсолютних співвідношень не буває. Кореляції з показниками 0,6 або більше, з позитивним чи негативним значенням, переважно вважаються тісно взаємопов'язаними, незалежно від типу змінних. Позитивні кореляції такого рівня можна виявити, скажімо, між належністю до певного соціального класу та поведінкою виборця при голосуванні.