72
Следующим этапом анализа является
сбор и статистическая оценка исходной информации,
которая будет использоваться в корреляционном анализе. Собранная исходная информация должна
быть проверена на достоверность, однородность и соответствие закону нормального распределения.
В первую очередь необходимо убедиться в
достоверности информации, насколько она
соответствует объективной действительности. Использование недостоверной, неточной информации
приведет к неправильным результатам анализа и выводам.
Одно из условий корреляционного анализа - однородность исследуемой информации относительно
распределения ее около среднего уровня. Если в совокупности имеются группы объектов, которые
значительно отличаются от среднего уровня, то это говорит о неоднородности исходной информации.
Критерием однородности информации служит среднеквадратическое отклонение и коэффициент
вариации, которые рассчитываются по каждому факторному и результативному показателю.
Среднеквадратическое отклонение показывает абсолютное отклонение индивидуальных значений от
среднеарифметического. Оно определяется по формуле:
Коэффициент вариации характеризует относительную меру отклонения отдельных значений от
среднеарифметической. Он рассчитывается по формуле:
Чем больше коэффициент вариации, тем относительно больший разброс и меньшая выравненность
изучаемых объектов. Изменчивость вариационного ряда принято считать незначительной, если
вариация не превышает 10 %, средней - если составляет 10-20 %, значительной - если она больше 20 %,
но не превышает 33 %. Если же вариация выше 33 %, то это говорит о неоднородности информации и
необходимости исключения нетипичных наблюдений, которые обычно бывают в первых и последних
ранжированных рядах выборки.
В нашем примере (табл. 7.4) самая высокая вариация по х
5
(V = 22,98), но она не превышает 33 %.
Значит, исходная информация является однородной и ее можно использовать для дальнейших расчетов.
На основании самого высокого показателя вариации можно определить
необходимый объем
выборки данных для корреляционного анализа по следующей формуле:
где п - необходимый объем выборки данных; V - вариация, %; t - показатель надежности связи, который
при уровне вероятности Р = 0,05 равен 1,96; т - показатель точности расчетов (для экономических
расчетов допускается ошибка 5-8 %).
Значит, принятый в расчет объем выборки (40 предприятий) является достаточным для проведения
корреляционного анализа.
|