Correspondence analysis (анализ соответствий) — это способ визуализации многомерных таблиц сопряженности. При помощи него создаются двухмерные карты, которые отражают зависимости между любым количеством столбцов и строк. Вам не нужно медитировать над многомерными таблицами, достаточно посмотреть на карту, где каждая строка и столбец превращаются в отдельную точку.
КАК ЭТО РАБОТАЕТ По математической сущности correspondence analysis очень похож на PCA (анализ главных компонент). Попарные расстояния между объектами (измеренные хи-квадратом) моделируется на двухмерную плоскость, как плоская тень объемного облака. Часть информации теряется, зато оставшаяся представляется в удобочитаемой форме.
Маркетологи используют этот инструмент для создания вот таких карт восприятия:
Карта восприятия отражает имидж и близость марок друг к другу
В других случаях анализ соответствий применяется в разведочном анализе данных:
для поиска наиболее дифференцирующих характеристик;
создания карт, которые отражают близость объектов, их характеристик и аудиторий;
визуализации абсолютно любых таблиц сопряженности.
Как создать карту восприятия имиджа бренда
1. Проведите опрос целевой аудитории Нужно задать вопрос:
«Какой марке больше всего подходит высказывание ______________?» В качестве ответа можно выбрать одну или несколько марок. Список высказываний ранжируется каждый раз.
2. Постройте перекрестную таблицу Такой тип таблиц также известен, как «сводная таблица» и «таблица сопряженности»
3. Примените correspondence analysis к перекрестной таблице Для этого понадобится функция из программы SPSS или Statistica, специальный макрос Excel или несколько строк на языке R:
функция для correspondence analysis в R
install.packages("MASS") #скачивание библиотеки для correspondence analysis
library(MASS) #подключение библиотеки
plot(corresp(mytable)) #где mytable - это перекрестная таблица с ответами респондентов
4. Корректно интерпретируйте результаты Чтобы сделать правильные выводы, обратите внимание на следующие показатели:
Доля инерции, которую объясняет каждая ось. Обычно 2-х осей хватает, чтобы объяснить 70-90% инерции исходных данных. Бывают случаи, когда для создания полной картины хватает одной оси, а бывает, что не хватает и четырех.
Квадрат косинуса. Этот показатель рассчитывается для каждой строки и столбца. Он отражает то, насколько точка на графике объясняется осью. Аналог корреляции с компонентов в PCA.
Абсолютный вклад. Используется для интерпретации осей. Строки и столбцы с высоким абсолютным вкладом являются определяющими геометрическую конфигурацию графика. Точки с минимальными значениями, наоборот, можно удалить из визуализации.
Пример карты аудитории публичных личностей, построенный путем применения анализа соответствий к социально-демографическим характеристикам и интересам их подписчиков в социальных сетях