Методология построения регрессионных моделей оценки объема продаж сети предприятий розничной торговли

Методология построения регрессионных моделей оценки объема продаж сети предприятий розничной торговли

Системный анализ прикладных возможностей современных математических методов прогнозирования в финансово-экономической сфере. Принципиальная схема построения и исследования регрессионных моделей анализа объема продаж в предприятиях розничной торговли.

Рубрика Экономико-математическое моделирование
Вид статья
Язык русский
Дата добавления 30.11.2016
Размер файла 49,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МЕТОДОЛОГИЯ ПОСТРОЕНИЯ РЕГРЕССИОННЫХ МОДЕЛЕЙ ОЦЕНКИ ОБЪЕМА ПРОДАЖ СЕТИ ПРЕДПРИЯТИЙ РОЗНИЧНОЙ ТОРГОВЛИ

Архипова Е.М., Власов Д.А., Насельский С.П.

МГОПУ им. М.А. Шолохова

Цель данной статьи — системный анализ прикладных возможностей современных математических методов прогнозирования в финансово-экономической сфере. Обобщив классические разделы регрессионного анализа, мы представляем принципиальную схему построения и исследования (7 этапов) регрессионных моделей оценки объема продаж сети предприятий розничной торговли.

Имеются следующие данные табл. 1 о зависимости объема продаж y (тыс. ед.) от затраченных денег на рекламу x1 (дес. тыс. долл.), количества сетей предприятий розничной торговли (сетей магазинов), продающих продукт фирмы в регионе — x2 (ед.), и уровня безработицы в регионе — x3 (%).

Проблема: Построить регрессионную модель и провести серию необходимых проверок для подтверждения ее статистической значимости.

Этап I. Построим регрессионную модель:

y — оценка объема продаж (тыс. ед.);

x1 — затраты на рекламу (дес. тыс. долл.);

x2 — число сетей предприятий розничной торговли (ед.);

x3 — уровень безработицы(%).

Данные таблицы являются исходной информацией для вычисления коэффициентов нормальных уравнений следующей системы:

Вычислим данные, необходимые для того, чтобы воспользоваться формулой и сведем их в таблицу 2.

Определим коэффициенты , которые являются оценками . Для этого используем формулы Крамера.

В результате проведенных расчетов получаем уравнение множественной регрессии:

Этап II. Вычислим множественную стандартную ошибку для уравнения (*).

Определим точечную оценку объема продаж для первого региона:

Фактическое значение объема продаж для первого региона y = 16. Следовательно, величина остатка

y = 16 — 15,89 =0,11.

Аналогично вычислим оценочные значения , остатки и их квадраты для остальных девяти регионов. Полученные данные сведем в табл. 3.

? y-= 0

?(y-)^2 = 24,85844721

Вычислим множественную стандартную ошибку регрессии по формуле

где n — число наблюдений, k — число независимых переменных. Получаем, что

Этап III. Вычислить значения R 2 , R, Rср 2 для регрессии. Используя все полученные выше данные, вычислим общую вариацию, = 22,4. Полученные данные занесем в табл. 4.

()^2

?()^2

вычислим R 2 :

R 2 = = 0,905265064.

Как видно из таблицы

вычислим скорректированный коэффициент Rср 2 :

Rср 2 = 1 — ( 1 — 0,905265064) • (10-1) / (10 — 3 — 1) = 0,857897596.

Определим R по формуле:

R = 0,951454184 (**)

Этап IV. Проверим существенность коэффициентов уравнения (*) при = 0,1.

Исходной информацией для расчетов является матрица:

С помощью программного обеспечения Microsoft Excel нами вычислены стандартные отклонения коэффициентов:

0,08769957; 0,907790908; 0,244071095

Далее вычислим t — статистики, используя формулу:

t1 = 2,210710561, t2 = 2,575602317, t3 = -0,666898793.

= t0,05;6 = 1,943,

Как видно, несущественным является коэффициент , так как

| t3| = 0,666898793 < 1,943. (***)

Проведем еще один тест, дополняющий t — тесты для отдельных коэффициентов регрессии. Он проверяет совместную способность k независимых переменных объяснять зависимую переменную.

Этот тест является проверкой нулевой гипотезы:

Нулевая гипотеза проверяется с помощью F — критерия:

С помощью F — статистики проверяется, действительно ли объясненная сумма квадратов отклонений превышает ту сумму квадратов отклонений, которая может быть случайной. Критический предел для F — статистики находится как значение F — распределения с параметрами (уровень значимости), k (число степеней свободы числителя), n k 1 (число степеней свободы знаменателя).

Коэффициент детерминации R 2 = 0,905265064. Определим F — отношение:

Зададимся критерием значимости = 0,05 и по статистической таблице найдем F0,05;3;6 = 4,76. Отсюда

F = 19,11153587 > 4,76,

т.е. гипотеза H0 отвергается при = 0,05. Следовательно, уравнение множественной регрессии в целом статистически значимо.

Этап VII. Выше было определено, что в регрессии объема продаж на три переменные переменная x3 (процент безработных) оказалась статистически незначимой. Поэтому в модели следует оставить только переменные x1 (затраты на рекламу) и x2 (количество сетей предприятий розничной торговли).

Модель (*) в этом случае будет иметь вид:

Ход вычислений аналогичен вышепоказанному варианту и произведен в программной среде Microsoft Excel. Полученные результаты сведем в таблицу 5.

Источник

Регрессионный анализ

На входе анализа – одна зависимая переменная и несколько независимых переменных, которые могут влиять на зависимую. Все переменные должны быть измерены по интервальным или дихотомическим шкалам. В случае, если в анализ необходимо включить порядковые переменные (например, степень согласия с рядом высказываний, измеренную по 5-балльной шкале), их необходимо предварительно оцифровать (с помощью статистического метода перекодировать в интервальные).

Алгоритм простой линейной регрессии выявляет степени влияния независимых переменных на зависимую и выдаёт регрессионное уравнение вида Y = а + b1X1 + b2X2…+…bnXn, где Y – зависимая переменная, а – константа, среднее значение Y, если каждая независимая переменная равна 0, Xn независимые переменные, bn – коэффициенты влияния независимых.

Узнайте о других решениях

Розничная торговля

Аналитика против интуиции: 4 кейса о том, как работает data-driven HR

TIBCO Spotfire для производства

Аналитика в науках о жизни

7 мифов об HR-аналитике

Что получаем в итоге?

Коэффициенты влияния показывают, какие из независимых переменных влияют на зависимую положительно, а какие отрицательно, а также какова степень этого влияния. В простой линейной регрессии коэффициент, больший 0, свидетельствует о положительном влиянии данной независимой переменной на зависимую, а коэффициент, меньший 0 – об отрицательной.

С помощью регрессионного уравнения можно моделировать разные комбинации независимых переменных и предсказывать, какое значение примет в этих случаях зависимая переменная.

Каковы преимущества метода?

Выявление факторов, способных наиболее сильно влиять на целевые маркетинговые показатели. В итоге мы получаем возможность концентрировать усилия на развитии тех параметров, которые способны улучшить ситуацию, и устранении тех, которые ухудшают целевой показатель.

Источник



2.8.2. Регрессионный анализ

где у — зависимая переменная (она всегда одна); хi — независимые переменные (факторы) (их может быть несколько). Если независимая переменная одна — это простой регрессионный анализ.

Построение уравнения регрессии осуществляется, как правило, методом наименьших квадратов, суть которого состоит в минимизации суммы квадратов отклонений фактических значений результатного признака от его расчетных значений, т.е.:

где т — число наблюдений; j = a + b1x1j + b2x2j+ . + bnхnj — расчетное значение результатного фактора. Коэффициенты регрессии рекомендуется определять с помощью аналитических пакетов для персонального компьютера или специального финансового калькулятора. В наиболее простом случае коэффициенты регрессии однофакторного линейного уравнения регрессии вида y = а + bх можно найти по формулам:

Рассмотрим использование методов корреляционного и регрессионного анализа на примере 2.13. Пример 2.13. Наибольшим спросом в торговых точках города, реализующих молочную продукцию, пользуется молоко «Лето», выпускаемое в пакетах объемом 1 литр. Цены за единицу этого товара в разных торговых точках города варьируют. Известно, что реализация этого продукта вносит существенный вклад в общую выручку торговых точек.

Показатели деятельности торговых предприятий, реализующих молоко «Лето», за II квартал 1999 г.

Показатели деятельности торговых предприятий, реализующих молоко Лето, за II квартал 1999 г.

Показатели деятельности торговых предприятий, реализующих молоко «Лето», за II квартал 1999 г. Продолжение

Показатели деятельности торговых предприятий, реализующих молоко Лето, за II квартал 1999 г. Продолжение

Анализ будем проводить с помощью табличного процессора MS Excel. Описательная статистика для представленных данных отражена в табл. 2.6. Таблица 2.Описательная статистика реализации молока «Лето» торговыми точками

Описательная статистика реализации молока «Лето» торговыми точками

Описательная статистика реализации молока Лето торговыми точками

1. Анализ следует начать с проверки однородности совокупности данных.

Условия нормальности выполняются, следовательно, по двум этим рядам данных можно строить регрессионную зависимость. Следующим шагом при построении регрессионной модели будет определение результативного и факторного признаков. Исходя из сути поставленной задачи, можно сказать, что в данном случае независимым фактором является цена за литр, объем реализации — признак зависимый (результатный). Регрессионная зависимость между факторами х и у (зависимость объема реализации молока от его цены) будет иметь вид:

Полученный результат — обратно пропорциональная зависимость между факторами — вполне согласуется со здравым смыслом: очевидно, что чем выше цена, тем менее привлекательна торговая точка для покупателей данного товара. Регрессионная зависимость позволяет строить прогноз величины результативного фактора при известной величине зависимого (т.е. прогноз объема реализации от цены за литр молока). Подставив, например, х = 12,40 руб. за литр в аналитическую формулу зависимости, получим ожидаемое значение объема реализации за квартал — y = 11,72 тыс. литров. 2. Определить, связан ли объем прибыли, полученной предприятиями торговли, с объемами реализации ими одного вида продукции, можно с помощью корреляционного анализа. Матрица корреляций, рассчитанная с помощью компьютера, выглядит так:

Величины коэффициентов парной корреляции факторов таковы:

Эти величины свидетельствуют о том, что между ценой товара (х) и объемом его реализации (у) связь весьма тесная (величина 0,82 говорит о том, что 82% вариации фактора у объясняются вариацией фактора х).

Источник

Применение корреляционно-регрессионного анализа

В системе статистической обработки данных и аналитики часто используется сочетание методик корреляции и регрессии. Создателем корреляционно-регрессионного анализа считается Фрэнсис Гальтон, который разработал теоретическую основу методологии в 1795 году. В конце 19 века многие европейские ученые в области теории статистики углубили познания в вопросе использования количественных измерителей для отражения связей между явлениями.

Что такое корреляционно-регрессионный анализ (КРА) предприятия?

Корреляционно-регрессионный анализ (КРА) на предприятиях используется для выявления связей между несколькими факторами хозяйственной деятельности и оценки степени взаимозависимости выбранных для анализа критериев. Методика использует два алгоритма действий:

  1. Корреляция, которая направлена на построение моделей связей.
  2. Регрессия, используемая для прогнозирования событий на основе наиболее подходящей для ситуации модели связей.

Анализ проводится в несколько шагов:

  • постановка задач проведения исследования;
  • массовый сбор информации: систематизация статистических данных по конкретным показателям деятельности предприятия в динамике за несколько периодов;
  • этап создания модели связей;
  • анализ функционирования модели, оценка ее эффективности.

Для проведения КРА необходимо использовать показатели в едином измерителе, все они должны иметь числовое значение.

ОБРАТИТЕ ВНИМАНИЕ! Для достоверности данных и работоспособности модели сведения должны быть собраны за длительный отрезок времени.

Для полноты анализа надо устранить количественные ограничения на показатели модели, должно соблюдаться условие постоянной временной и территориальной структуры рассматриваемой совокупности элементов.

Где используется корреляционно-регрессионный анализ?

ВАЖНО! Пример проведения корреляционно-регрессионного анализа от КонсультантПлюс доступен по ссылке

Основные ситуации применения КРА:

  1. Тестирование отношения между несколькими величинами: выявляется, что именно этот показатель является влияющим, а второй – зависимым.
  2. Определение связи между двумя переменными факторами без уточнения причинно-следственного блока сведений.
  3. Расчет показателя по изменению значения другого фактора.

Корреляционно-регрессионная методика анализа может применяться для подготовки данных о разных сторонах деятельности компании. В бизнесе построение моделей зависимости одного показателя от других факторов и дальнейшая эксплуатация выведенной математической формулы позволяют отслеживать оперативное изменение текущей ситуации в выбранном сегменте хозяйствования и быстро принимать управленческие решения.

Например, благодаря КРА можно постоянно отслеживать уровень рыночной стоимости предприятия. Для этого на начальных этапах проводится сбор информации о динамике изменения рыночной стоимости и статистических показателей всех возможных факторов влияния:

  • уровень выручки;
  • рентабельность;
  • размер активов;
  • сумма непогашенной дебиторской или кредиторской задолженности;
  • резерв сомнительных долгов и др.

Для каждого критерия строится модель, которая выявляет, насколько сильно фактор может влиять на рыночную стоимость бизнес-проекта. Когда все модели построены, оценивается их работоспособность и адекватность. Из комплекса данных выбирается тот тип взаимосвязей, который отвечает требованиям объективности и достоверности. На основе полученной схемы связей создается уравнение, которое позволит получать прогнозные данные об изменении рыночной стоимости при условии изменения значения конкретного фактора.

Методику можно применять при формировании ценовой политики, составлении бизнес-планов, проработке вопроса о расширении ассортиментного ряда и в других сегментах предпринимательства.

Задачи, виды и показатели корреляционно-регрессионного анализа

Задачи КРА заключаются в:

  • идентификации наиболее значимых факторов влияния на конкретный показатель деятельности предприятия;
  • количественном измерении тесноты выявленных связей между показателями;
  • определении неизвестных причин возникновения связей;
  • всесторонней оценке факторов, которые признаны наиболее важными для рассматриваемого показателя;
  • выведении формулы уравнения регрессии;
  • составлении прогноза возможного результата деятельности при изменении ключевых связанных факторов с учетом возможного влияния других факторных признаков.

КРА подразумевает использование нескольких видов корреляционных и регрессионных методов. Зависимости выявляются при помощи корреляций таких типов:

  • парная, если связь устанавливается с участием двух признаков;
  • частная – взаимосвязь оценивается между искомым показателем и одним из ключевых факторов, при этом условием задается постоянное значение комплекса других факторов (то есть числовое выражение всех остальных факторов в любых ситуациях будет приниматься за определенную неизменную величину);
  • множественная – основу исследования составляет влияние на показатель деятельности не одного фактора, а сразу нескольких критериев (двух и более).

СПРАВОЧНО! Выявленные показатели степени тесноты связей отражаются коэффициентом корреляции.

На выбор коэффициента влияет шкала измерения признаков:

  1. Шкала номинальная, которая предназначена для приведения описательных характеристик объектов.
  2. Шкала ординальная нужна для вычисления степени упорядоченности объектов в привязке к одному и более признакам.
  3. Шкала количественная используется для отражения количественных значений показателей.

Регрессионный анализ пользуется методом наименьших квадратов. Регрессия может быть линейной и множественной. Линейный тип предполагает модель из связей между двумя параметрами. Например, при наличии таких двух критериев, как урожайность клубники и полив, понятно, что именно объем поступающей влаги будет влиять на объем выращенной и собранной клубники. Если полив будет чрезмерным, то урожай пропадет. Урожайность же клубники никак не может воздействовать на систему полива.

Множественная регрессия учитывает более двух факторов одновременно. В случае с клубникой при оценке ее урожайности могут использоваться факторы полива, плодородности почвы, температурного режима, отсутствия слизняков, сортовые особенности, своевременность внесения удобрений. Все перечисленные показатели в совокупности оказывают комплексное воздействие на искомое значение – урожайность ягод.

Система показателей анализа формируется критериями классификации. Например, при экстенсивном типе развития бизнеса в качестве показателей могут выступать такие факторы:

  • количество сотрудников;
  • число заключенных договоров за отчетный период;
  • посевные площади;
  • прирост поголовья скота;
  • расширение дилерской сети;
  • объем основных фондов.

При интенсивном типе развития могут применяться следующие показатели:

  • производительность труда;
  • рентабельность;
  • урожайность;
  • фондоотдача;
  • ликвидность;
  • средний объем поставок в отчетном периоде по одному договору.

Оценка

Для оценки достоверности и эффективности модели связей необходимо построить матрицу коэффициентов. Коэффициент в случае парной корреляции вычисляется по формуле:

Диапазон значений коэффициента ограничивается показателями от -1 до +1. Если итоговое значение было получено со знаком плюс, то между рассматриваемыми переменными имеется прямая связь. Если в результате расчетов значение оказалось отрицательным, то связь будет обратной, то есть при увеличении одного из показателей другой связанный с ним фактор будет уменьшаться. Пример прямой связи – увеличение посевных площадей будет способствовать росту объема собираемой с полей продукции. Пример обратной связи – увеличение посевных площадей сопровождается снижением урожайности.

Качественный аспект тесноты связи между рассматриваемыми в аналитических расчетах показателями можно оценивать, основываясь на шкале Чеддока.

В соответствии с ее нормами связь будет расцениваться как сильная при значении коэффициента корреляции по абсолютным данным величины выше 0,7. Положительный или отрицательный знак сопровождает числовое значение – неважно, ориентироваться необходимо только на число. Если коэффициент после вычислений оказался ниже 0,3, то связь можно считать слабой.

Для дальнейших этапов анализа выбираются факторы с высокой степенью связанности. Все остальные критерии, для которых установлена слабая связь, отбрасываются. На основании полученных сведений определяется вид математического уравнения регрессии. Рассчитывается численное значение оценки параметров регрессии, определяются качества полученной модели регрессии.

Источник

Читайте также:  Анализ графической информации Часть 1
Adblock
detector