1 5 Основные этапы статистического анализа эмпирической информации

1.5. Основные этапы статистического анализа эмпирической информации

Слово «информация» в переводе с латинского означает осведом­ление и доведение сведений о чем-либо. Очевидно, в общем случае под информацией следует понимать любые сведения (в количественной и качественной форме) об исследуемом объекте. Естественно, что со статистической точки зрения наибольший интерес вызывает количественная информация, частным случаем которой является гидрометеорологическая информация. Объектом гидрометеорологической информации служит, как известно, природная среда.

Всю совокупность информации целесообразно разделить на первичную и вторичную. Первичная информация – это результат непосредственного измерения метеорологических, гидрологических, океанологических и иных параметров со стационарной сети станций, постов, полученных во время экспедиций, натурных экспериментов, а также с помощью наземных, самолетных, спутниковых измерительных комплексов и т.д.

Вторичная информация уже представляет результаты расчетов, выполненных на основе первичной информации. Так, например, данные по испарению могут представлять собой первичную информацию, если оно измерено с помощью малоинерционной аппаратуры, или вторичную информацию, если испарение рассчитывается тем или иным методом. Отметим, что основной в этом случае является вторичная информация по испарению.

Логическая схема статистического анализа эмпирических данных какого-либо процесса или явления может быть представлена в виде следующих основных этапов (рис. 1.5):

Этап 1: постановка задачи. Сюда входит формулирование основных целей предполагаемого исследования и возможных результатов, которые могут быть получены с его помощью. Естественно, что в каждом конкретном случае формулирование целей носит произвольный характер и осуществляется на содержательном (физическом) уровне. При этом правильное физическое представление изучаемого процесса или явления является тем «базисом», на который затем ставится «надстройка», представляющая собой совокупность статистических методов. Следовательно, важной составной частью постановки задачи должен служить предварительный физический анализ исследуемого реального процесса или явления, отображением которого выступает система исходных наблюдений (измерений). После этого осуществляется формализованная постановка задачи, включающая по возможности вероятностную модель или совокупность статистических методов, которые могут быть применены к анализу изучаемой системы данных. Кроме того, в случае необходимости выполняется оценка общего времени и трудозатрат на выполнение исследования.

Этап 2: информационный. В том случае, если задача поставлена таким образом, что реальные экспериментальные данные для ее решения отсутствуют, то необходимым условием данного этапа становится предварительное составление плана сбора исходной статистической информации. При этом желательно учитывать полную схему дальнейшего статистического анализа с тем, чтобы не возникали ситуации, когда становится очевидной невозможность проведения расчетов из-за отсутствия необходимых для этого данных. Если экспериментальные данные имеются в необходимом объеме, но только в табличном виде, то возникает задача их занесения на машинные носители, т.е. создание компьютерных архивов данных. Хотя эта задача носит технический характер, тем не менее следует предварительно составить такую схему занесения данных в ЭВМ, чтобы в последующем их было удобно обрабатывать.

Этап 3: первичный анализ. В ходе первичной статистической обработки исходной информации обычно решаются следующие конкретные задачи:

— унификация типа переменных, т.е. перевод их в единую однородную систему;

— расчет и анализ первичных статистик;

— анализ резко выделяющихся наблюдений (выбросов);

— восстановление пропущенных наблюдений;

— проверка статистической независимости наблюдений, составляющих массив исходных данных;

— проверка свойств внутренней структуры временного ряда с помощью статистических гипотез;

— экспериментальный анализ закона распределения исходной совокупности и его параметризация.

Отметим, что задача унификации типа переменных возникает при автоматизированном анализе многомерного случайного процесса, когда одновременно могут встречаться переменные всех трех типов: количественные, ординальные и номинальные. В этом случае используются два альтернативных подхода. Первый связан с «оцифровкой» (шкалированием) неколичественных переменных, когда исследователь, руководствуясь дополнительными соображениями и допущениями, пытается преобразовать качественные данные в количественные. При другом подходе все наблюдения многомерной случайной величины смешанной природы делятся на определенное число градаций (интервалов, классов и т.п.), внутри которых все данные заменяются на нули или единицы. Естественно, при переходе от индивидуальных к сгруппированным значениям происходит потеря информативности исходных данных, но это неизбежная плата за подобные преобразования.

Этап 4: построение эмпирических зависимостей. К данному этапу относятся следующие конкретные задачи:

— определение вида связи между переменными;

— построение и анализ линейной регрессии двух переменных;

— построение и анализ одномерной полиномиальной регрессии;

— подбор нелинейной эмпирической формулы;

— построение и анализ двухмерной полиномиальной регрессии;

— построение и анализ множественной линейной регрессии.

Этап 5: анализ временных рядов. При проведении временного анализа решаются

следующие конкретные задачи:

— проверка стационарности временного ряда;

— построение и анализ трендов;

— фильтрация временных рядов.

Этап 6: анализ пространственных полей. Данный этап включает в себя:

— определение числовых характеристик полей;

— оценка однородности и изотропности случайного поля;

— анализ статистической структуры полей;

— построение и анализ карт;

— объективный анализ случайных полей.

Сразу же отметим, что для этапов 3 — 6 перечислены в основном лишь те задачи, которые непосредственно рассмотрены в данном пособии. Безусловно, список их может быть существенно расширен. Следует также иметь в виду, что разделение на этапы во многом является условным. Прежде всего оно не означает, что эти этапы осуществляются в строгой хронологической последовательности один за другим. Некоторые из них могут быть объединены вместе, другие, исходя из специфики исходного материала, вообще пропущены. Кроме того, ряд этапов (например, 3, 4, 5 и 6 этапы) находится в соотношении итерационного взаимодействия: результаты более поздних этапов могут содержать выводы о необходимости повторения предыдущих этапов (см. рис. 1.4).

Этап 7: интерпретация результатов и подведение итогов исследования. Очевидно, это самый неформальный этап. Получение содержательных выводов – главный итог выполненного исследования. Однако прежде делается формальный статистический отчет, представляющий собой выводы из применения статистических процедур, результаты которых даются в виде таблиц, графиков, формул и т.п. Именно это и служит основой для формулирования содержательных выводов.

Читайте также:  Где сдать анализ тироксин общий Т4 общий

Отметим, что анализ получаемых результатов должен осуществляться не только в конце исследования, но и после каждого этапа, причем в зависимости от этого они могут подвергаться ревизии (пересмотру). Например, один статистический метод заменен другим, выдвигается новая вероятностная модель и т.д.

В заключение проверяется, в какой степени достигнуты намеченные на первом этапе исследования цели и если не все они достигнуты, то объясняется, с чем это связано.

Источник

Этапы организации и проведения эмпирического исследования

Эмпирическое исследование состоит из нескольких этапов:

2) сбор информации;

3) статистическая обработка полученной информации;

4) формулирование выводов;

5) разработка конкретных предложений по результатам исследований.

1) Проведению исследования должна предшествовать тщательная подготовка, обязательным элементом которой является составление программы.

Разработка программы эмпирического исследования включает:

• Постановку целей и задач исследования.

• Определение его предмета и объекта.

• Сбор и анализ необходимых источников (нормативных актов, научных работ, результатов прежних аналогичных исследований и проч.).

• Выработку рабочих гипотез (предположений, проверяемых в процессе исследования).

• Разработку инструментария исследования – т.е. тех конкретных методик, которые будут применяться в процессе сбора информации (справок, анкет, опросных листов, плана интервью и др.).

• Составление плана-графика исследования, где с учетом трудоемкости каждого этапа исследования отражается сроки выполнения каждого из них.

2) Вторым этапом эмпирических исследований выступает непосредственный сбор студентом информации в соответствии с выбранной методикой.

3) Третий этап – статистическая обработка полученной информации. На этом этапе студент осуществляет подсчет полученных данных по показа-телям, отраженном в программе исследования.

4) На четвертом этапе студент формулирует выводы. Выводы целесообразно делать следующим образом:

а) Первоначально должны быть обобщены полученные результаты, составлены сводные таблицы изучения практики, осуществлен подсчет не только абсолютных, но и относительных показателей.

б) Затем студент должен на базе полученных данных вычленить эм-пирический факт. При этом могут быть использованы методы сравнения, классификации и т.д.

в) В завершении за эмпирическим фактом студент должен сделать вывод о наличии теоретического факта.

5) Последним, пятым этапом проведения эмпирического исследования, является разработка конкретных предложений по результатам исследования. В этом случае студент может сделать рекомендации по внесению изменений в законодательство (принятие новых нормативно-правовых актов, корректировка действующих нормативных предписаний), по совершенствованию существующей практики и т.д.

Качественное выполнение студентом последнего этапа эмпирического исследования является показателем проведения исследования на хорошем уровне и оценивается достаточно высоко.

Результаты эмпирических исследований должны быть приведены сту-дентом не только в соответствующих таблицах и включены в курсовую ра-боту в качестве приложения, но и использованы в теоретической части ра-боты для обоснования выводов, иллюстрации рассуждений полученными статистическими данными и т.д.

Содержание курсовой работы

1.7.1. Как и любая научно-исследовательская работа курсовая должна включать следующие разделы:

ВВЕДЕНИЕ

В нем раскрывается актуальность, практическая значимость, цель и задачи, объект и предмет исследования.

ОСНОВНАЯ ЧАСТЬ включает, как правило, 2 ‒ 3 главы.

Глава 1. Анализ современной литературы и журнальных научных публикаций по выбранной проблеме, реферирование различных точек зрения авторов, обоснование выбора методологической базы эмпирического исследования, определение собственной исследовательской позиции, обоснование конкретных целей и задач собственного исследования.

Обязательными являются ссылки на использованные источники и соблюдение этики цитирования.

Глава 2. Описание организации, методов и методик исследования, обоснование выбора методик (раскрытие возможностей использованных экспериментальных и диагностических методов и методик, технологии их применения, методов обработки данных, методов анализа). Характеристика выборки испытуемых, с обоснованием критериев отбора.

Глава 3. Анализ данных исследования. Общая характеристика полученных данных: количество, полнота для числовых данных. Описание статистической и содержательной обработки полученных данных. Анализ и интерпретация полученных результатов. Результаты должны быть представлены как в текстовой форме, так и в табличной и графической.

Выводы в виде тезисов, в краткой форме представляющих основные результаты работы, пишутся либо в конце каждой главы, либо как отдельная глава ВЫВОДЫ. Выводы должны точно соответствовать задачам исследования.

ЗАКЛЮЧЕНИЕ

В нем обсуждается соответствие полученных результатов поставленным задачам исследования, трудности, перспективы разработки проблемы.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ (Приложение Б).

ПРИЛОЖЕНИЕ

Требования к содержанию курсовой работы

Содержание введения

Во введении автор определяет актуальность, цель, объект и предмет исследования, перечисляет задачи исследования. Задачи исследования могут быть решены с помощью методов, которые применяет исследователь в своей работе.

Рекомендуется отметить также новизну и практическую значимость исследования (как они представляются автору работы).

Исследование должно проводиться на конкретной базе. В качестве базы исследования могут выступать медицинские и фармацевтические организации, предприятия, учреждения и т.д.

1. Цель исследования формулируется, исходя из проблемы, которую следует разрешить студенту в процессе выполнения работы и представляет собой в самом сжатом виде тот результат (результаты), который планируется получить. Цель исследования формулируется лаконично и четко и должна соответствовать теме исследования.

2. Объект исследования − это то явление, на которое направлен процесс познания. Объект может служить как определенным процессом, так и явлением, которое побуждает проблемную ситуацию, то есть это категория, которая обозначает целостность, выделенную из реального мира, и выступает в качестве области человеческого познания.

Существует несколько точек зрения на формулирование объекта исследования. Отметим, что если в исследовании присутствуют реальные испытуемые (группа респондентов), то при формулировании объекта необходимо конкретизировать выборку. Например: «Объект исследования: больные сахарным диабетом, женщины, в возрасте 40-45 лет, в количестве 50 человек».

3. Предмет исследования ‒ это наиболее важные признаки, свойства, стороны, отношения реальных объектов, рассматриваемые в определенных условиях, и исследуемые с определенной целью.

Предмет исследования подразумевает конкретную часть объекта, внутри которого ведется научный поиск.

Предмет исследования должен быть четко обозначен для того, чтобы "принадлежность" его к объекту исследования не вызывала сомнения, то есть предмет исследования ‒ это формулировка того, что изучает студент. Предмет исследования может существовать лишь в голове у исследователя. Другими словами, предмет исследования может зависеть только от знания автора работы.

Читайте также:  Смысл произведения 171 Соловей 187

4. В соответствии с целью и предметом исследования логически определяются задачи исследования (должно быть не больше трех задач).

5. Методы исследования – это способы познания явлений и процессов реальной действительности. В случае научного исследования методы, применяемые в нём, должны быть описаны кратко, и при этом полностью отражать используемый диагностический аппарат. Следует описывать методы исследования, по следующей схеме (Б.Г. Ананьев):

· Организационные методы исследования (сравнительный, комплексный).

· Эмпирические методы исследования (наблюдение, измерение, эксперимент, беседа, архивный, психодиагностический и т.д.).

· Методы обработки данных (качественные: контент – анализ, типологизация, классификация и т.п.; количественные: методы математико-статистической обработки данных и т.д.).

Источник



Статистический анализ эмпирических даных

Начинать статистический анализ полученных в результате обследования данных следует с так называемой описательной (первичной) статистики.

Как правило, анализ данных начинается с оценки характера распределения данных по всем используемым параметрам (признакам). Распределение признака имеет некоторые числовые характеристики. Чаще всего рассматриваются: среднее, процентили, квартили, минимальное и максимальное значение, стандартное отклонение.

По характеру распределения можно составить общую характеристику выборки по исследуемым признакам, а также получить представление о некоторых характеристиках используемых методик. Эти данные также используются для разделения выборки на группы в зависимости от степени выраженности исследуемого признака, для выделения наиболее типичных или нетипичных для данной выборки испытуемых.

Таким образом, на основании данных первичной (описательной) статистики мы даем общую характеристику выборки или проводим сравнительное описание нескольких выборок.

Для того, чтобы распространить выводы о тенденциях, отмеченных в изучаемых выборках, на всю генеральную совокупность, необходимо использовать более строгие статистические критерии, позволяющие оценить статистическую значимость результатов. В психологии достоверным признается результат с уровнем значимости (p<0,05). Уровень статистической значимости можно определять с помощью различных статистических критериев.

Для выбора критерия данных также необходима информация о характере распределения. Для параметров, имеющих нормальное распределение (форма которого описывается кривой Гаусса) или близкое к нормальному, можно использовать методы параметрической статистики: сравнительный анализ, расчет достоверности различий признака между выборками (t-критерий Стьюдента, F- критерий Фишера, коэффициент корреляции Пирсона и др.).

Если распределение показателей исследуемых признаков далеко от нормального, то следует использовать методы непараметрической статистики (расчет достоверности отличий по критерию Q Розенбаума, U- критерию Манна-Уитни, коэффициент ранговой корреляции Спирмена, факторный, кластерный и др.).

Также выбор способов статистического анализа зависит от задач исследования. Чаще всего в эмпирическом исследовании решают задачу выявления различий между двумя или более группами признаков. Для оценки достоверности этих различий обычно используется t-критерий Стьюдента (для нормального распределения) или U-критерий Манна Уитни, критерий Вилкоксона (для распределения, отличающегося от нормального). Другая довольно часто встречающаяся задача – выявление связей между изучаемыми параметрами. Самый распространенный метод решения этой задачи – корреляционный анализ. Для грамотного применения методов статистического анализа следует подробнее познакомиться с ними по специальной литературе и в специальных курсах.

Для статистической обработки данных удобно использовать компьютерные программы, такие как SPSS, Statistica, Statgraf и др.

При описании результатов эмпирического исследования цифровой материал представляется в табличном и графическом виде. Таблицы и графики размещают в тексте либо непосредственно после их первого упоминания в тексте, либо на следующей странице. Все таблицы и рисунки обязательно нумеруются и получают свои названия, точно отражающие содержание. Любые иллюстрации (графики, диаграммы, схемы и пр.) обозначаются как рисунки. Все строки и столбцы таблицы должны также иметь названия, как и линии, столбцы, секторы в диаграмме. Примеры оформления таблицы и диаграммы представлены ниже. В таблицах допускается применять шрифт меньший, чем в тексте. Слишком большие таблицы лучше помещать в приложение. Если таблица занимает больше одной страницы, ее продолжают на следующей странице, при этом над второй частью таблицы повторяется шапка таблицы и делается надпись: «Таблица 1, продолжение». Если шапка таблицы слишком громоздкая, допустимо пронумеровать столбцы и повторить нумерацию во второй части. В случае необходимости под таблицей или рисунком может размещаться примечание с пояснительными надписями (условные обозначения, сокращения и пр.). Если таблица занимает меньше одной страницы, она не должна разрываться и переносится на следующую страницу.

Источник

Классификация статистических методов анализа эмпирических данных.

Статистические методы — методы анализа статистических данных.

Выделяют методы прикладной статистики, которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой.

Эмпирические данные — то есть данные полученные опытным путем.

Обычно процесс эмпирического исследования включает следующие этапы:

1. Определение предмета и объекта исследования, постановка его цели и задач;

2. Планирование исследования и выдвижение рабочих гипотез;

* Выборка для эмпирического исследования;

* Выбор методов и методик.

3. Проведение исследования, направленного на сбор эмпирического материала;

4. Обработка эмпирических данных;

5. Обсуждение и интерпретация данных;

6. Формулировка выводов, подтверждающих или опровергающих гипотезы.

Сбор эмпирического материала представляет собой ответственную часть исследования. Организационная работа и практическое проведение методик изучения требуют от исследователя ряда особых умений. Необходимо предусмотреть, чтобы объект исследования был доступен для практического контакта с ним в условиях, необходимых для изучения. Важно правильно спланировать время, место и обстоятельства экспериментальной работы, скорректировать их в зависимости от реальных условий. Испытуемые не должны быть озабочены срочными делами и чрезмерным дефицитом времени для выполнения задания. Их не должны отвлекать посторонние раздражители. Для успеха исследовательской работы на данном этапе обязательно практическое владение соответствующей техникой сбора эмпирических данных, детальное знание методов и методик, которые используется.

Обработка эмпирических данных исследования делится обычно на несколько этапов:

Первичная обработка данных

* Преобразование формы информации

Статистический анализ данных

* Анализ первичных статистик

Читайте также:  Когда меняется анализ крови при вич

* Оценка достоверности отличий

Использование методов математической статистики при обработке первичных эмпирических данных необходимо для повышения достоверности выводов научного исследования. При этом не рекомендуется ограничиваться использованием таких показателей, как средние арифметические и проценты. Они чаще всего не дают достаточных оснований для обоснованных выводов из эмпирических данных.

Выбор метода статистического анализа полученных эмпирических данных — очень важная и ответственная часть исследования. И делать это лучше до того, как получены данные. При планировании исследования необходимо заранее продумать, какие эмпирические показатели будут регистрироваться, с помощью каких методов будут обрабатываться, и какие выводы при разных результатах обработки можно будет сделать.

При выборе статистического критерия нужно, прежде всего, идентифицировать тип переменных (признаков) и шкалу измерения, которая использовалась при измерении показателей и других переменных — например, возраст, состав семьи, уровень образования. В качестве переменных могут выступать любые показатели, которые можно сравнивать друг с другом (то есть измерять). Следует иметь в виду, что в исследованиях могут широко использоваться номинативные и порядковые шкалы: вербальные и невербальные поведенческие реакции пол, уровень образования — все это может рассматриваться в качестве переменных. Главное — иметь четкие и ясные критерии их отнесения к тому или иному типу в зависимости от поставленных гипотез и задач.

При выборе статистического критерия нужно ориентироваться также на тип распределения данных, который получился в исследовании. Параметрические критерии используются в том случае, когда распределение полученных данных рассматривается как нормальное. Нормальное распределение с большей вероятностью (но не обязательно) получается при выборках более 100 испытуемых (может получиться и при меньшем количестве, а может не получиться и при большем). При использовании параметрических критериев необходима проверка нормальности распределения.

Для непараметрических критериев тип распределения данных не имеет значения. При небольших объемах выборки испытуемых целесообразно выбрать непараметрические критерии, которые дают большую достоверность выводам, независимо от того, получено ли в исследовании нормальное распределение данных. В некоторых случаях статистически обоснованные выводы могут быть сделаны даже при выборках в 5—10 испытуемых.

Во многих исследованиях осуществляется поиск различий в измеряемых показателях у испытуемых, имеющих те или иные особенности. При обработке соответствующих данных могут использоваться критерии для выявления различий в уровне исследуемого признака или в его распределении. Для определения значимости различий в проявлении признака в исследованиях часто используются такие показатели, как парный критерий Вилкоксона, U-критерий Манна—Уитни, критерий х-квадрат (х2), точный критерий Фишера, биномиальный критерий.

Во многих исследованиях осуществляется поиск взаимосвязи исследуемых показателей у одних и тех же испытуемых. Для обработки соответствующих данных могут использоваться коэффициенты корреляции. Связь величин друг с другом и их зависимость часто характеризуется коэффициентом линейной корреляции Пирсона и коэффициентом ранговой корреляции Спирмена.

Структура данных (и соответственно структура изучаемой реальности), а также их взаимосвязь выявляется факторным анализом.

Во многих исследованиях интерес представляет анализ изменчивости признака под влиянием каких-либо контролируемых факторов, или, другими словами, оценка влияния разных факторов на изучаемый признак. Для математической обработки данных в таких задачах может использоваться U-критерий Манна—Уитни, критерий Краскела—Уоллиса, Т-критерий Вилкоксона, критерий ?2 Фридмана. Однако для исследования влияния, а тем более взаимовлияния нескольких факторов на изучаемый параметр полезнее может оказаться дисперсионный анализ. Исследователь исходит из предположения, что одни переменные могут рассматриваться как причины, а другие как следствия. Переменные первого рода считаются факторами, а переменные второго рода — результативными признаками. В этом отличие дисперсионного анализа от корреляционного, в котором предполагается, что изменения одного признака просто связаны с определенными изменениями другого.

Во многих исследованиях выявляется значимость изменений (сдвига) каких-либо параметров и проявлений за определенный промежуток времени, в определенных условиях (например, в условиях коррекционного воздействия). Формирующие эксперименты в практической психологии решают именно эту задачу. Для обработки соответствующих данных могут использоваться коэффициенты для оценки достоверности сдвига в значениях исследуемого признака. Для этого часто применяются критерии знаков, Т-критерий Вилкоксона.

Важно обратить внимание на ограничения, которые имеет каждый критерий. Если один критерий не подходит для анализа имеющихся данных, всегда можно найти какой-либо другой, возможно, изменив тип представления самих данных. Прежде чем проводить статистический анализ эмпирических данных, полезно проверить, существуют ли критические значения, соответствующие количеству и типу ваших данных. В противном случае вас может ждать разочарование, когда ваши подсчеты окажутся напрасными по причине отсутствия в таблице критических значений при объеме выборки, которая у вас была.

После знакомства с процедурой вычисления критерия можно проводить «ручную» обработку данных или воспользоваться статистической программой персонального компьютера. Для компьютерной обработки наиболее популярны программы SPSS и Statistica.

Использование статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и предоставляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы. Однако в полной мере эти преимущества могут быть использованы, если исследователь имеет необходимый уровень подготовки в этой области. Обычно, чем мощнее компьютерная программ (чем более широкие у неё возможности), тем больше времени она требует для освоения. Таким образом, затрачивать время на её изучение при редких обращениях к мощному статистическому аппарату не совсем эффективно. Очень часто использование таких программ для решения даже несложных задач также требует определённой суммы умений.

Для того, чтобы избежать лишних сложностей и временных затрат, гораздо эффективнее обратиться к профессионалам. Они качественно и профессионально проведут весь необходимый математико-статистический анализ данных вашего исследования: анализ первичных статистик, оценку достоверности различий, нормирование данных, корреляционный и факторный анализ и т.п.

После проведения необходимого статистического анализа данных нужно соотнести полученные результаты с изначально поставленной гипотезой, с теоретическими обоснованиями авторов, которые исследовали данную тематику и предыдущими исследователями. Сформулировать выводы и проинтерпретировать полученные результаты.

Источник

Adblock
detector