Конфирматорный факторный анализ используется для
Факторный анализ
Дается определение одного из распространенных многомерный методов статистического анализа – факторного анализа. Описана основная суть этого статистического метода и основные области его применения. Дается характеристика двум видам факторного анализа: эксплоаторному и конфирматорному факторному анализу.
Факторный анализ
Определение
Факторный анализ – это процедура, с помощью которой большое число переменных, сводится к меньшему количеству независимых влияющих величин, называемых факторами. При этом в один фактор объединяются переменные (признаки), сильно коррелирующие (связанные) между собой. Переменные (признаки), относящиеся к разным факторам слабо коррелируют между собой.
Области применения факторного анализа
Факторный анализ используется при исследовании сложных объектов и систем (например, в психологии, биологии, социологии, экономике и др.) в том случае, когда напрямую невозможно измерять величины, определяющие свойства этих объектов (так называемые факторы). Однако для измерения доступны другие величины (переменные, признаки), которые зависят от этих факторов. Иными словами, фактор, который мы не можем измерить напрямую, проявляется в изменении нескольких переменных.
В области физической культуры и спорта в роли переменных могут выступать результаты тестирования уровня технической, физической, тактической подготовленности спортсменов, а также результаты медико-биологических и педагогических исследований.
Виды факторного анализа
Существует два основных вида факторного анализа – эксплораторный (исследовательский, разведочный) и конфирматорный (подтверждающий гипотезу).
Более подробно о методах статистической обработки данных рассказано в книгах:
- «Факторный анализ в педагогических исследованиях в области физической культуры и спорта»
- «Информационные технологии в обработке анкетных данных в педагогике и биомеханике спорта»
- «Компьютерная обработка данных экспериментальных исследований»
Эксплоаторный факторный анализ
Эксплораторный факторный анализ проводится на ранних этапах исследования, когда почти ничего не известно о структуре изучаемого явления и имеется значительное количество исходных данных. Цель проведения такого анализа – выявление латентной внутренней структуры и снижение размерности, то есть сокращение количества исследуемых переменных за счет объяснения их через новые факторные переменные. В ходе этого анализа, если необходимо, формулируются гипотезы, которые могут быть использованы для дальнейшего исследования.
Конфирматорный факторный анализ
Конфирматорный факторный анализ проводится для подтверждения уже выработанных гипотез. Этот вид факторного анализа имеет строгие показатели и строгие критерии. Он предполагает, что уже выявлено какое-то количество факторов, необходимых для исследования и служит инструментом для проверки правильности выработанных гипотез, подтверждения выбранной структуры. Изучаемые факторы тщательно продумываются и подбираются.
Источник
Конфирматорный
Основное содержание табл. 39 — величины а11 . а25 — факторные нагрузкипеременных 1 . 5 (строки) по факторам 1 и 2 (столбцы). Факторные нагрузки — аналоги коэффициентов корреляции, показывают степень взаимосвязи соответствующих переменных и факторов: чем больше абсолютная величина факторной нагрузки, тем сильнее связь переменной с фактором, тем больше данная переменная обусловлена действием соответствующего фактора.
Фактор – это искусственный статистический показатель, который получается в результате преобразований корреляционной матрицы.
Процедура извлечения факторов называется факторизацией.
Факторные нагрузки (факторные веса) – коэффициенты корреляции каждого фактора с каждой переменной.
Каждый фактор идентифицируется по тем признакам, с которыми он в наибольшей степени связан (наибольшие нагрузки). Идентификация фактора заключается, как правило, в присвоении ему имени обобщающего по смыслу наименования входящих в него переменных.
Общность переменной – это сумма квадратов факторных нагрузок. Она показывает часть дисперсии признака, которая является общей для двух (в данном случае) переменных.
Переменные с большей общностью имеют значительно большую долю дисперсии с одним или несколькими факторами.
Низкая общность означает, что ни один из факторов не имеет совпадающей доли дисперсии с данной переменной. Низкая общность может свидетельствовать о том, например, что переменная измеряет нечто качественно отличающееся от других признаков, включённых в анализ.
Собственные значения фактора – это значимость каждого из факторов.
В нижней строчке приводится доля дисперсии фактора – часть дисперсии в выборке, которая объясняется данным фактором.
Факторный анализ бывает двух видов:
Используется для анализа результатов исследования для того, чтобы сформулировать рабочие гипотезы о причинах обнаруженных связей. Выполняется на ориентировочной стадии работы.
Применяется на более поздних стадиях исследования для проверки гипотез. Когда в рамках какой-либо теории или модели сформулированы чёткие гипотезы, факторы между переменными и факторами достаточно определены, и исследователь может их прямо указать. В этом случае факторный анализ является средством проверки соответствия сформулированной гипотезы полученным эмпирическим данным.
Факторный анализ может выполняться различными методами (о различии методов см. учебник Наследова).
Анализ главных компонент.При использовании этого метода общность каждой переменной получается автоматически, путем суммирования квадратов ее нагрузок по всем главным компонентам. Вопрос о приближении восстановленных коэффициентов корреляции к исходным корреляциям не решается. В результате факторная структура искажается в сторону преувеличения абсолютных величин факторных нагрузок.
Факторный анализ образов— это метод главных компонент, применяемый к так называемой редуцированной корреляционной матрице, у которой вместо единиц на главной диагонали располагаются оценки общностей. Общность каждой переменной оценивается предварительно, как квадрат коэффициента множественной корреляции (КМК) этой переменной со всеми остальными. Такая оценка, с точки зрения теоретиков факторного анализа, приводит к более точным результатам, чем в анализе главных компонент. Но значения общностей недооцениваются, что также приводит к искажениям факторной структуры, хотя и меньшим, чем в предыдущем случае.
Метод главных осейпозволяет получить более точное решение. На первом шаге общности вычисляются по методу главных компонент. На каждом последующем шаге собственные значения и факторные нагрузки вычисляются исходя из предыдущих значений общностей. Окончательное решение получается при выполнении заданного числа итераций или достижении минимальных различий между общностями на данном и предыдущем шагах.
Метод не взвешенных наименьших квадратов— минимизирует квадраты остатков (разностей) исходной и воспроизведенной корреляционных матриц (вне главной диагонали). Процесс повторяется многократно до тех пор, пока не достигается минимально возможная разница между исходными и вычисленными корреляциями при заданном числе факторов. Метод, по определению, дает минимальные ошибки факторной структуры при фиксированном числе факторов. Реализация метода в компьютерных программах позволяет проверить расхождения между исходными и вычисленными корреляциями. Наличие многочисленных расхождений может служить дополнительным аргументом в пользу увеличения числа факторов.
Обобщенный метод наименьших квадратов— отличается от предыдущего тем, что для каждой переменной вводятся специальные весовые коэффициенты. Чем больше общность переменной, тем в большей степени она влияет на факторную структуру (имеет больший вес). Это соответствует основному принципу статистического оценивания, по которому менее точные наблюдения учитываются в меньшей степени. В этом — основное преимущество этого метода перед остальными.
Метод максимального правдоподобиятакже направлен на уменьшение разности исходных и вычисленных корреляций между признаками. Дополнительно этот метод позволяет получить важный показатель полноты факторизации — статистическую оценку «качества подгонки». Однако следует помнить, что этот критерий, как и остальные формальные критерии, является дополнительным. Окончательное же решение о числе факторов принимается после содержательной интерпретации факторной структуры.
Вряд ли возможно дать общие рекомендации о преимуществе или недостатке того или иного метода. Можно лишь отметить, что анализ главных компонент дает наиболее грубое решение, а метод максимального правдоподобия позволяет статистически оценить минимально возможное число факторов для данного набора переменных. По-видимому, в каждом конкретном случае стоит сравнивать результаты применения разных методов и выбирать тот, который позволяет получить наиболее простую и доступную интерпретации факторную структуру.
Источник
Конфирматорный факторный анализ.
Все описанные выше модели ФА относятся к эксплораторному(поисковому) ФА. Настоящим переворотом в ФА было изобретениеконфирматорного(подтверждающего) анализа – КФА.
Основной принцип КФА: в качестве гипотезы формируется структура ожидаемой матрицы факторных нагрузок (весов), которая затем накладывается на заданную корреляционную матрицу. Гипотеза подвергается статистической проверке, и постепенно исследователь приходит к соответствующей экспериментальным данным матрице нагрузок, не прибегая к вращению факторов.
Однако гипотеза должна основываться на серьёзном анализе природы изучаемых переменных и лежащих в их основе факторов. Часто для этого проводится предварительный эксплораторный ФА. В качестве математического аппарата в данной модели используется моделирование с помощью линейных структурных уравнений.
Данный подход предполагает априорное формулирование гипотез относительно количества латентных и измеряемых переменных, а также их взаимосвязи. Можно выделить следующие этапы:
Составляется диаграмма путей, представляющих собой графы, в которых присутствуют измеряемые и латентные переменные, соединённые стрелками (направлены в сторону влияний);
Строятся системы уравнений множественной регрессии; их количество соответствует количеству зависимых переменных;
Проверяется соответствие предложенной модели (системы уравнений) эмпирическим данным;
Осуществляется перебор моделей на данных одной выборки.
Метод КФА позволяет оценить валидность тестов (конструктную, дискриминантную, конвергентную). Использование множества индикаторов для каждого латентного конструкта даёт возможность представить степень, с которой каждая переменная объясняет латентную переменную. Остаточная дисперсия обусловлена случайными флуктуациями. С помощью параметров измерительной модели определяется внутренняя согласованность теста, по которой можно говорить об уровне надёжности измерения. В программе LISRELнадёжность измеряемых переменных представляется в виде множественных корреляций этих переменных с латентными конструктами (P.Bentler, 1982, 1992;D.Cole, 1987). Моделирование с помощью латентно-структурных уравнений позволяет также проводить анализ данных лонгитюдного исследования с множественными индикаторами (K.Joreskog, 1979, 1988).
Модель латентных классов.
Все модели латентных структур предполагают локальную независимость характеристик. То есть, для данной латентной характеристики наблюдаемые переменные независимы в смысле теории вероятностей.
В основе модели лежит формула Бэйеса (с учётом экспериментальных данных) их апостериорной плотности распределения. Априорно задаются две латентные характеристики: количество классов (K)и соответствующее им относительное число испытуемых в классе –P(k), а также параметр, позволяющий устанавливать степень вероятности определённого ответа наi-й вопрос при условии, что испытуемый относится кk-му классу –r(k). Априорное задание этих латентных характеристик соответствует гипотезе исследователя, либо задаётся стандартными способами.
Вероятность появления i-го профиля
.
По формуле Бэйеса вычисляется апостериорная (с учётом реальных профилей ответов на вопросы теста) вероятность принадлежности к классу kпри условии, что испытуемый имеетi-паттерн ответов:
.
Для каждого класса строится наиболее вероятный профиль ответов его представителей.
Источник
Конфирматорный факторный анализ.
Все описанные выше модели ФА относятся к эксплораторному (поисковому) ФА. Настоящим переворотом в ФА было изобретение конфирматорного (подтверждающего) анализа – КФА.
Основной принцип КФА: в качестве гипотезы формируется структура ожидаемой матрицы факторных нагрузок (весов), которая затем накладывается на заданную корреляционную матрицу. Гипотеза подвергается статистической проверке, и постепенно исследователь приходит к соответствующей экспериментальным данным матрице нагрузок, не прибегая к вращению факторов.
Однако гипотеза должна основываться на серьёзном анализе природы изучаемых переменных и лежащих в их основе факторов. Часто для этого проводится предварительный эксплораторный ФА. В качестве математического аппарата в данной модели используется моделирование с помощью линейных структурных уравнений.
Данный подход предполагает априорное формулирование гипотез относительно количества латентных и измеряемых переменных, а также их взаимосвязи. Можно выделить следующие этапы:
Составляется диаграмма путей, представляющих собой графы, в которых присутствуют измеряемые и латентные переменные, соединённые стрелками (направлены в сторону влияний);
Строятся системы уравнений множественной регрессии; их количество соответствует количеству зависимых переменных;
Проверяется соответствие предложенной модели (системы уравнений) эмпирическим данным;
Осуществляется перебор моделей на данных одной выборки.
Метод КФА позволяет оценить валидность тестов (конструктную, дискриминантную, конвергентную). Использование множества индикаторов для каждого латентного конструкта даёт возможность представить степень, с которой каждая переменная объясняет латентную переменную. Остаточная дисперсия обусловлена случайными флуктуациями. С помощью параметров измерительной модели определяется внутренняя согласованность теста, по которой можно говорить об уровне надёжности измерения. В программе LISREL надёжность измеряемых переменных представляется в виде множественных корреляций этих переменных с латентными конструктами (P.Bentler, 1982, 1992; D.Cole, 1987). Моделирование с помощью латентно-структурных уравнений позволяет также проводить анализ данных лонгитюдного исследования с множественными индикаторами (K.Joreskog, 1979, 1988).
Модель латентных классов.
Все модели латентных структур предполагают локальную независимость характеристик. То есть, для данной латентной характеристики наблюдаемые переменные независимы в смысле теории вероятностей.
В основе модели лежит формула Бэйеса (с учётом экспериментальных данных) их апостериорной плотности распределения. Априорно задаются две латентные характеристики: количество классов (K) и соответствующее им относительное число испытуемых в классе – P(k), а также параметр, позволяющий устанавливать степень вероятности определённого ответа на i-й вопрос при условии, что испытуемый относится к k-му классу – r(k). Априорное задание этих латентных характеристик соответствует гипотезе исследователя, либо задаётся стандартными способами.
Вероятность появления i-го профиля
По формуле Бэйеса вычисляется апостериорная (с учётом реальных профилей ответов на вопросы теста) вероятность принадлежности к классу k при условии, что испытуемый имеет i-паттерн ответов:
Для каждого класса строится наиболее вероятный профиль ответов его представителей.
Источник