Диплом, курсовая, контрольная работа
Помощь в написании студенческих работ

Статистический анализ эмпирических распределений

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Соответственно существуют коэффициенты асимметрии и эксцесса и стандартные ошибки для этих коэффициентов. Коэффициент асимметрии оценивает, насколько распределение симметрично относительно центра. Коэффициент эксцесса оценивает крутизну распределения, т. е. степень выпада вершины распределения относительно кривой нормального распределения. Эксцесс имеет смысл оценивать только тогда, когда… Читать ещё >

Статистический анализ эмпирических распределений (реферат, курсовая, диплом, контрольная)

Министерство Образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Санкт — Петербургский политехнический университет»

Инженерно-экономический институт предпринимательства и коммерции КУРСОВАЯ РАБОТА по дисциплине «Статистика»

на тему «Статистический анализ эмпирических распределений»"

Выполнила:

студентка группы № з33 707/26

Паланча Е.В.

Принял: Доцент, к.э.н.

Понамарёва О.А.

Санкт-Петербург 2014

ДК 657.63 (075.4)

Е.В. Паланча Статистика: Учебное пособие /Сборник регионов России «Анализ распределения регионов России по показателю» Пет-к.: Изд-во Политехн. ун-та, 2014. 20с.

«СТАТИСТИЧЕСКИЙ АНАЛИЗ ИМПЕРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ. ОСНОВНЫЕ ПОКАЗАТЕЛИ ДЕЯТЕЛЬНОСТИ МАЛЫХ ПРЕДПРИЯТИЙ ЗА 2011г»

В курсовой работе на основе данных показателей деятельности построены таблицы распределения регионов России, графики распределения, рассчитаны и проанализированы показатели центра, структуры, формы распределения. Сделаны выводы по распределительным показателям.

Табл. 7 Рис. 3

Содержание Введение

1. Построение таблицы и графиков ряда распределения

2. Показатели центра распределения

3. Показатели структуры распределения

4. Показатели вариации

5. Характеристика формы распределения

Заключение

Список используемых источников

ВВЕДЕНИЕ

Курсовая работа была выполнена на основе данных сборника Ростстата «Регионы России социально-экономические показатели» 2012 г.

Изучалась распределение показателей регионов России по показателям оборота малых предприятий млрд. руб. Объём исходной совокупности — единиц.

Ряд распределения — это распределение единиц совокупности по значению того или иного признака. Комплексный анализ ряда распределения включает:

— Табличное и графическое представление ряда распределения;

— Расчёт и анализ показателей центра и структуры распределения;

— Расчёт и анализ показателей вариации;

— Характеристику формы распределения;

— Выбор теоретического распределения, которому соответствует изучаемое эмпирическое.

Ряды распределения могут быть:

1) Вариационными;

2) Атрибутивными.

Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер. Закономерности распределения наиболее отчетливо проявляются только при большом количестве наблюдений (т.н. закон больших чисел).

1. ПОСТРОЕНИЕ ТАБЛИЦЫ ГРАФИКОВ РЯДА РАСПРЕДЕЛЕНИЯ В курсовой работе данные были ранжированы, т. е регионы России были распределены по возрастанию.

Таблица 1

Ранжирование вариационного ряда — это расположение единиц совокупности в порядке возрастания или убывания значений признака. Построение ранжированного ряда позволяет увидеть наличие или отсутствие выбросов.

На основе ранжированных данных были исключены выбросы.

Выбросыэто единицы совокупности, значения признака которых резко отличаются в меньшую или большую сторону от основной массы значений признака.

Выбросы из анализа были исключены, т. к не подчиняются общей закономерности распределения. На основе подготовленных данных строилась таблица распределения с этой целью рассчитывался интервал группировки.

Определяем величину интервала:

= 163

Таблица 2

Распределения регионов России по обороту малых предприятий за 2011 г.

В таблицах первая графа наименования (From To) содержит интервалы значений признака «Оборот малых предприятий по регионам россии в данном интервале».

Второй столбец «Count» — абсолютные частоты (fi), т. е. число единиц совокупности, обладающих указанным значением признака.

Cumulative Count — накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам. Сумма накопленных частот по каждой строке означает, какое количество единиц совокупности (регионов) имеет значение признака, не превышающее значения верхней границы данного интервала.

Percent — частости (относительные частоты, wi; выражаются в процентах), рассчитываются где: fi — число единиц i-той группы; - общее число единиц в совокупности; wi — доля каждой группы в общем объеме совокупности.

Cumulative percent — накопленные частости — это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.

Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т. е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.

Пример:

Прокомментируем цифры в строке третьего интервала:

6 — означает число регионов в данном интервале.

61- число единиц совокупности, обладающих указанным значением признака.

9,09- доля каждой группы в общем объеме совокупности.

92,42- это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.

Для более наглядного представления вариационного ряда используют статистические графики.

Статистический график представляет собой чертеж, на котором при помощи условных геометрических фигур (линий, точек или других символических знаков) изображаются статистические данные. В результате этого достигается наглядная характеристика изучаемой статистической совокупности.

Правильно построенный график делает статистическую информацию более выразительной, запоминающейся и удобно воспринимаемой.

Традиционно для изображения вариационных рядов распределения в отечественной практике используются графики: гистограмма, полигон, кумулята.

Гистограмма — это диаграмма в виде столбцов, на которой графически показано изменение какой-либо величины.

Рис. 1 Гистограмма распределения регионов России по обороту Малых предприятий за 2011 г Полигон-называется ломаная линия, соединяющая точки с координатами.

Рис. 2 Полигон распределения регионов России по обороту малых предприятий за 2011 г Кумулята — или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости.

Рис. 3 Кумулята распределения регионов России по обороту малых предприятий за 2011 г Из двух графиков предподчителен гистограмма, т. к отражает величину интервала.

2. Показатели центра распределения распределение ранжирование вариационный показатель Среднее значение признаков совокупности, мода и медиана характеризуют центральную тенденцию распределения, указывают тот уровень признака, который является типичным, характерным для данной совокупности. Использование того или иного показателя распределения зависит от типа исходных данных и цели исследования. Поскольку средняя величина рассчитывается на единицу совокупности, но с использованием всех индивидуальных значений признака, она является обобщённой характеристикой всей совокупности.

Формулы расчёта. Средняя арифметическая простая:

где — значение признака у i_ой единицы совокупности, n — объём совокупности.

Медиана-значение признака единицы совокупности стоящий в центре ранжированного ряда.

Медиана:

Ме где — нижняя граница медианного интервала, — величина группировочного интервала, — сумма частот (), — накопленная частота интервала, предшествующего медианному; - частота медианного интервала.

Мода — это значение показателя вокруг которого концентрируются значительная часть единицы совокупности, т. е имеют значения близкие к модальному.

Мода:

45−0-0

Мо= 45+163* (45−0)+(45−10)=136,69

где — нижняя граница модального интервала, — величина группировочного интервала, — частота модального интервала,

/ - частота интервала, предшествующего / следующего за модальным.

Таблица 3

Показатели центра и структуры распределения

Показатель центра

Значение

Среднее значение

214,52

Медиана

142,45

Мода

136,69

В среднем в регионах России оборот малых предприятий за 2011 г. составил 214,52 млрд руб. В 50% регионов России оборот малых предприятий за 2011 г. составил 142,45 млрд руб.

3. Показатели структуры распределения К показателям структуры, кроме медианы, также относят квартили, которые делят совокупность на четыре части, децили (10 частей) и прочие показатели. Использование тех или иных характеристик зависит от цели исследования и от объёма изучаемой совокупности (с увеличением объёма растёт число групп). В данной работе необходимо подсчитать только медиану и квартили.

Формулы расчёта. Нижний квартиль:

.

Верхний квартиль:

.

Таблица 4

Показатели структуры

Показатель структуры

Значение

Нижний квартиль

94,1

Медиана

142,45

Верхний квартиль

264,6

В среднем в 25% в Регионах России оборот малого бизнеса не привышает 94,1 млрд руб. и не выше 264,6 млрд руб.

4. показатели вариации Вариация — различия у индивидуального значения признака изучаемой совокупности. Расчёт показателей центра сопровождается расчётом показателей вариации. Показатели вариации бывают:

— Абсолютные (размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение);

— Относительные (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации).

Формулы расчёта. Размах вариации:

где и — максимальное и минимальное значение признака совокупности.

Дисперсия:

где — значение признака у i_ой единицы совокупности, — средняя арифметическая, — частота у i_ой единицы совокупности, — сумма частот ().

Среднее квадратическое (стандартное) отклонение:

.

Коэффициент вариации:

Таблица 5

Показатели вариации

Показатель вариации

Значение

Размах вариации R

816,2

Дисперсия 2

33 220,44

Среднее квадратическое отклонение

214,52

Коэффициент вариации V

0,85%

Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 816,2 единицы. Дисперсия содержательно не интерпретируется, однако является важнейшим показателем вариации, на основе которого рассчитывается ряд статистических показателей, в том числе и коэффициент вариации, в данном случае равный 0,85%.Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность не однородна, т.к. коэффициент вариации больше 33%, значит существенна. В среднем величина по регионам России за 2012 г отличалась от среднего на 182,26 величин.

5. характеристики формы распределения Форма распределения имеет следующие характеристики:

— Асимметрия;

— Эксцесс (куртозис).

Соответственно существуют коэффициенты асимметрии и эксцесса и стандартные ошибки для этих коэффициентов. Коэффициент асимметрии оценивает, насколько распределение симметрично относительно центра. Коэффициент эксцесса оценивает крутизну распределения, т. е. степень выпада вершины распределения относительно кривой нормального распределения. Эксцесс имеет смысл оценивать только тогда, когда в эмпирическом распределении присутствует несущественная асимметрия.

Формулы расчёта. Коэффициент асимметрии:

.

Стандартная ошибка:

.

Коэффициент эксцесса:

.

Стандартная ошибка:

.

Таблица 6

Показатели формы

Показатель формы

Значение

Коэффициент асимметрии As

1,72

Стандартная ошибка As

0,29

Коэффициент эксцесса Es

2,58

Стандартная ошибка Es

0,58

Дисперсию не возможно прокомментировать. Правосторонняя асимметрия коэффициент равен 1,72.T статистика эксцесса в данном случае не оценивается, т. к положительный коэффициент эксцесса.

ЗАКЛЮЧЕНИЕ

В среднем в регионах России оборот малых предприятий за 2011 г. составил 214,52 млрд руб. Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность не однородна, т.к. коэффициент вариации больше 33%. (V=0,85%).Распределение имеет правостороннюю асимметрию, эксцесс не оценивается т. к коэффициент эксцесса положительный.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Учебное пособие. Статистика. Анализ эмпирического распределения. Н. В. Куприенко, О. А. Пономарёва, Д. В. Тихонов. 95 с. 2010.

Показать весь текст
Заполнить форму текущей работой