Изучим ещё один подход к оценке корреляционной связи, который предложил немецкий психолог Г. Фехнер и превзошёл в простоте своего коллегу, англичанина Ч. Спирмена. Коэффициент корреляции Фехнера тоже является ранговым коэффициентом, но в отличие от коэффициента Спирмена использует лишь два ранга: «да-нет», «больше / меньше среднего». Поэтому заварим булки, расслабим цикорий и посмотрим, как кошки помогают налаживать жизни людей:
– Среди семейных пар, живущих долго и счастливо, был проведён опрос: «Как вы относитесь к кошке в доме?». ДопустИмы лишь два ответа: положительный либо отрицательный; нейтральная позиция засчитывается положительно («ничего не имею против»). В результате исследования выяснилось, что в парах мнения супругов совпадают, а в парах – нет (т. е. кто-то «за», а кто-то «против»).
В результате появляется возможность оценить корреляционную зависимость семейного счастья от согласия по этому вопросу. Вычислим коэффициент корреляции Фехнера, по формуле:
…В большинстве источников приведены именно такие буквенные обозначения, и я не буду отступать от мейнстрима.
Коэффициент корреляции Фехнера (как и линейный и коэффициент Спирмена) изменяется в тех же пределах и интерпретируется по той же шкале:
при этом если , то корреляционная связь обратная, а если , то прямая.
Таким образом, можно сделать вывод, что кошки здесь особо ни при чём :) А вот успеваемость, вероятнее всего, имеет значение – вернёмся к нашему подопытному примеру:
Пример 80
Имеются выборочные данные по студентам: – количество прогулов за некоторый период времени и – суммарная успеваемость за этот период:
Найти коэффициент корреляции Фехнера, сделать вывод.
Решение: в отличие от шуточной вводной задачи, здесь у нас даны количественные показатели, и для расчёта коэффициента корреляции Фехнера выполняем следующие действия. Сначала найдём среднееколичество прогулов:
после чего каждому значению присваиваем свой ранг:
– если больше либо равно , то ставим «плюс»;
– и если меньше, чем , то «минус».
Аналогично находим:
– среднюю успеваемость и каждому значению присваиваем ранг по тому же принципу:
– если , то «плюс»;
– если , то «минус».
Решение удобно оформлять таблицей:
Теперь в каждой паре нужно сравнить ранги: если знаки совпадают, то ставим единичку (правый столбец), а если не совпадают – то ноль.
В чём логика такого ранжирования и сравнения? Если студент прогуливает меньше среднего , то по идее, его успеваемость должна быть выше средней . И наоборот, если гуляет больше – то и успевает хуже . И, как мы видим, всё так и есть, за исключение уникума под номером пять, который и прогуливает больше среднего и успевает выше среднего (правда, ненамного).
Осталось подсчитать количество совпадений (впрочем, считать тут нечего): , количество несовпадений: и вычислить коэффициент корреляции Фехнера:
, таким образом, существует сильная обратная корреляционная зависимость суммарной успеваемости от количества прогулов . И это подтвердилось уже в 3-й раз: линейная корреляция дала результат , а ранговая Спирмена – .
…И возможно, некоторые читатели до сих пор не до конца понимают, что такое корреляционная зависимость. Навёрстываем упущение! – об этом понятии речь зашла ещё в статье Аналитической группировка.
Коэффициент корреляции Фехнера также называют коэффициентом корреляции знаков. И характеризует он степень согласованности отклонений соответствующих значенийотносительно своих средних . …Переварили фразу? :) …Молодцы!
Задачу легко решить вручную (если объём совокупности невелик) или опять же в MS Excel, и я даже запилил небольшой ролик на эту тему:
Следующее задание для самостоятельного решения, по социологии:
Пример 82
По результатам выборочного исследования 10 сотрудников организации получены следующие данные:
Высказать предположение о наличии и направлении корреляционной зависимости размера заработной платы от уровня IQ. Вычислить коэффициент корреляции Фехнера между показателями, сделать выводы.
Все числа в экселевском файле – решаем! И не заморачивайтесь такой ерундой, как IQ.
Как я уже отмечал, коэффициент Фехнера особо уместен, когда в исследовании есть гипотеза о сопоставлении показателей по принципу «да / нет», «больше / меньше среднего». Но существуют и «противопоказания». Так, если среди эмпирических данных есть числа, сильно отличающиеся от средних значений, то подход Фехнера становится непригоден. Это характерно для многих нелинейных зависимостей. Поэтому будьте начеку!
И в заключение урока, да и почти всего курса ещё раз хочу порекомендовать статистику для ваших исследований в других областях – экономике, социологии, психологии, медицине и т. д.
Пример 81. Решение: чем выше IQ сотрудников, тем больше может быть их средняя заработная плата. Таким образом, предполагаем наличие прямой («чем больше, тем больше») корреляционной зависимости заработной платы от уровня IQ.
Вычислим средние значения признаков: – средний IQ; ден. ед. – средняя з/п.
Каждому значению присвоим ранг: «+», если и «–», если . Аналогично присвоим ранги значениям :
Сравним ранги в каждой паре (правый столбец) и подсчитаем количество совпадений: . Найдём количество несовпадений:
Вычислим коэффициент корреляции Фехнера: , таким образом, существует заметная прямая корреляционная зависимость заработной платы от IQ, что подтверждает выдвинутое предположение.