Все о тюнинге авто

Расчет средней величины в интервальном вариационном ряду. Например, средняя арифметическая для интервального ряда

При статистической обработке итогов изысканий самого различного рода полученные значения зачастую группируются в последовательность промежутков. Для расчета обобщающих колляций таких последовательностей изредка доводится вычислять середину интервала – «центральную варианту». Способы ее расчета довольно примитивны, но имеют некоторые особенности, вытекающие как из применяемой для измерения шкалы, так и из нрава группировки (открытые либо закрытые промежутки).

Инструкция

1. Если промежуток является участком постоянной числовой последовательности, то для нахождения ее середины используйте обыкновенные математические способы вычисления среднеарифметического значения. Минимальное значение интервала (его предисловие) сложите с максимальным (окончанием) и поделите итог напополам – это один из методов вычисления среднеарифметического значения. Скажем, это правило применимо, когда речь идет о возрастных интервала х. Скажем, серединой возрастного интервала в диапазоне от 21 года до 33 лет будет отметка в 27 лет, потому что (21+33)/2=27.

2. Изредка бывает комфортнее применять иной способ вычисления среднеарифметического значения между верхней и нижней границами интервала . В этом варианте вначале определите ширину диапазона – отнимите от максимального значения минимальное. После этого поделите полученную величину напополам и прибавьте итог к минимальному значению диапазона. Скажем, если нижняя граница соответствует значению 47,15, а верхняя – 79,13, то ширина диапазона составит 79,13-47,15=31,98. Тогда серединой интервала будет 63,14, потому что 47,15+(31,98/2) = 47,15+15,99 = 63,14.

3. Если промежуток не является участком обыкновенной числовой последовательности, то вычисляйте его середину в соответствии с повторяемостью и размерностью применяемой измерительной шкалы. Скажем, если речь идет об историческом периоде, то серединой интервала будет являться определенная календарная дата. Так для интервала с 1 января 2012 года по 31 января 2012 серединой будет дата 16 января 2012.

4. Помимо обыкновенных (закрытых) промежутков статистические способы изысканий могут оперировать и «открытыми». У таких диапазонов одна из границ не определена. Скажем, открытый промежуток может быть задан формулировкой «от 50 лет и старше». Середина в этом случае определяется способом аналогий – если все остальные диапазоны рассматриваемой последовательности имеют идентичную ширину, то предполагается, что и данный открытый промежуток имеет такую же размерность. В отвратном случае вам нужно определить динамику метаморфозы ширины промежутков, предшествующих открытому, и вывести его условную ширину, исходя из полученной склонности метаморфозы.

Изредка в повседневной деятельности может появиться надобность обнаружить середину отрезка прямой линии. Скажем, если предстоит сделать выкройку, эскиз изделия либо легко распилить на две равные части деревянный брусок. На поддержка приходит геометрия и немножко житейской смекалки.

Вам понадобится

  • Циркуль, линейка; булавка, карандаш, нить

Инструкция

1. Воспользуйтесь обыкновенными инструментами, предуготовленными для измерения длины. Это самый легкой метод разыскать середину отрезка. Измерьте линейкой либо рулеткой длину отрезка, поделите полученное значение напополам и отмерьте от одного из концов отрезка полученный итог. Вы получите точку, соответствующую середине отрезка.

2. Существует больше точный метод нахождения середины отрезка, вестимый из курса школьной геометрии. Для этого возьмите циркуль и линейку, причем линейку может заменить всякий предмет подходящей длины с ровной стороной.

3. Установите расстояние между ножками циркуля так, дабы оно было равным длине отрезка либо же огромным, чем половина отрезка. После этого поставьте иглу циркуля в один из концов отрезка и проведите полуокружность так, дабы она пересекала отрезок. Переставьте иглу в иной конец отрезка и, не меняя размах ножек циркуля, проведите вторую полуокружность верно таким же образом.

4. Вы получили две точки пересечения полуокружностей по обе стороны от отрезка, середину которого мы хотим обнаружить. Объедините эти две точки при помощи линейки либо ровного бруска. Соединительная линия пройдет в точности посередине отрезка.

5. Если под рукой не оказалось циркуля либо длина отрезка значительно превышает возможный размах его ножек, дозволено воспользоваться простым приспособлением из подручных средств. Изготовить его дозволено из обыкновенной булавки, нитки и карандаша. Привяжите концы нитки к булавке и карандашу, при этом длина нитки должна немножко превышать длину отрезка. Таким импровизированным заменителем циркуля остается проделать шаги, описанные выше.

Видео по теме

Полезный совет
Довольно верно обнаружить середину доски либо бруска вы можете, использовав обыкновенную нитку либо шнур. Для этого отрежьте нить так, дабы она соответствовала длине доски либо бруска. Остается сложить нить верно напополам и разрезать на две равные части. Приложите один конец полученной мерки к концу измеряемого предмета, а 2-й конец будет соответствовать его середине.

Расчет средней величины в интервальных вариационных рядах немного отличается от расчета в рядах дискретных. Как рассчитать среднюю арифметическую и среднюю гармоническую в дискретных рядах можно посмотреть вот . Такое различие вполне объяснимо – это связано с особенностью , в которых изучаемый признак приведен в интервале от и до.

Итак, посмотрим особенности расчета на примере.

Пример 1. Имеются данные о дневном заработке рабочих предприятия.

Число рабочих, чел.
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Начало решения задачи будет аналогичным правилам расчета средней величины, которые можно посмотреть .

Начинаем мы с определения варианты и частоты, поскольку ищем мы средний заработок за день, то варианта это первая колонка, а частота вторая. Данные у нас заданы явным количеством, поэтому расчет проведем по формуле средней арифметической взвешенной (так как данные приведены в табличном виде). Но на этом сходства заканчиваются и появляются новые действия.

Дневной заработок рабочего, руб. х Число рабочих, чел. f
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Дело в том, что интервальный рад представляет осредняемую величину в виде интервала. 500-1000, 2000-2500 и так далее. Чтобы решить эту проблему необходимо провести промежуточные действия, и только потом подсчитать среднюю величину по основной формуле.

Что же требуется в данном случае сделать. Все достаточно просто, чтобы провести расчет нам нужно, чтобы варианта была представлена одним числом, а не интервалом. Для получения такого значения находят так называемое ЦЕНТРАЛЬНОЕ ЗНАЧЕНИЕ ИНТЕРВАЛА (или середину интервала). Определяется оно путем сложение верхней и нижней границ интервала и делением на два.

Проведем необходимые расчеты и подставим данные в таблицу.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’
500-1000 15 750
1000-1500 30 1250
1500-2000 80 1750
2000-2500 60 2250
2500-3000 25 2750
Итого 210

После того как мы рассчитали центральные значения далее проведем расчеты в таблицы и подставим итоговые данные в формулу, аналогично тому как мы уже рассматривали ранее.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’ x’f
500-1000 15 750 11250
1000-1500 30 1250 37500
1500-2000 80 1750 140000
2000-2500 60 2250 135000
2500-3000 25 2750 68750
Итого ∑f = 210 ∑ x’f = 392500


В итоге получаем, что среднедневная заработная плата одного рабочего составляет 1869 рублей.

Это пример решения, если интервальный ряд представлен со всеми закрытыми интервалами. Но достаточно часто бывает, когда два интервала открытые, первый и последний. В таких ситуациях прямой расчет центрального значения невозможен, но есть два варианта как это сделать.

Пример 2. Имеются данные о продолжительности производственного стажа персонала предприятия. Рассчитать среднюю продолжительность стада одного сотрудника.

Число сотрудников, человек
до 3 19
3-6 21
6-9 15
9-12 10
12 и более 5
Итого 70

В данном случае принцип решения останется точно таким же. Единственно, что поменялось в этой задаче, так это первый и последний интервалы. До 3 лет и 12 лет и более это и есть те самые открытые интервалы. Именно тут возникнет вопрос, а как же найти центральное значение интервала для таких интервалов.

Поступить в этой ситуации можно двумя способами:

  1. Предположить какой бы мог быть интервал, учитывая, что нам приведены интервалы равные, то это вполне возможно. Интервал до 3 мог бы выглядеть как 0-3, и тогда его центральное значение будет (0+3)/2 = 1,5 года. Интервал 12 и более мог бы выглядеть как 12-15, и тогда его центральное значение было бы (12+15)/2 = 13,5 года. Все оставшиеся центральные значения интервала рассчитываются аналогично. В результате получаем следующее.
Длительность производственного стажа, лет х Число сотрудников, человек f х’ x’f
до 3 19 1,5 28,5
3-6 21 4,5 94,5
6-9 15 7,5 112,5
9-12 10 10,5 105,0
12 и более 5 13,5 67,5
Итого ∑f = 70 ∑ x’f = 408,0

Средняя продолжительность стажа 5,83 года.

  1. Принять за центральное значение, то данное которое имеется в интервале, без дополнительных расчетов. В нашем случае в интервале до 3 это будет 3, а в интервале 12 и более это будет 12. Такой способ больше подходит для ситуаций, когда интервалы неравные и предположить какой интервал мог бы быть сложно. Рассчитаем нашу задачу по таким данным далее.
Длительность производственного стажа, лет х Число сотрудников, человек f х’ x’f
до 3 19 3 57,0
3-6 21 4,5 94,5
6-9 15 7,5 112,5
9-12 10 10,5 105,0
12 и более 5 12 60,0
Итого ∑f = 70 ∑ x’f = 429,0

Средняя продолжительность стажа 6,13 года.

Домашнее задание

  1. Рассчитать средний размер посевной площади на одно фермерское хозяйство по следующим данным.
Размер посевной площади, га Количество фермерских хозяйств
0-20 64
20-40 58
40-60 32
60-80 21
80-100 12
Итого 187
  1. Рассчитайте средний возраст работника предприятия по следующим данным
Возраст персонала, лет Число сотрудников, человек
до 18 7
18-25 68
25-40 79
40-55 57
55 и старше 31
Итого 242

Теперь Вы умеете рассчитывать среднюю в интервальном вариационном ряду!

Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.

В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.

Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:

Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):

Примеры применения данных формул представлены в задачах 1 и 2.

Широко распространенным на практике показателем является среднее квадратическое отклонение :

Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.

Формула для расчета коэффициента вариации.

Примеры решения задач по теме «Показатели вариации в статистике»

Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:

Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.

Решение

1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).

Средний размер вклада найдем по формуле средней арифметической взвешенной:

29 000/50 = 580 руб.

Дисперсию вклада найдем по формуле:

23 400/50 = 468

Аналогичные действия произведем для банка без рекламы :

2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.

3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.

4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.

5) Определим общую дисперсию, используя правило сложения.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04

6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.

7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.

Задача 2 . Имеется группировка предприятий по величине товарной продукции:

Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.

Решение

1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).

В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).

Расчет средней величины товарной продукции делаем по формуле:

Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:

Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.

2) Дисперсию найдем по следующей формуле:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.

4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем - среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.

Пример 3 . Определить средний возраст студентов вечернего отделения.

Возраст в годах

Число студентов

Среднее значение интервала

Произведение середины интервала (возраст) на число студентов

до 20

(18 + 20) / 2 =19 18 в данном случае граница нижнего интервала. Вычисляется как 20 - (22-20)

20 - 22

(20 + 22) / 2 = 21

22 - 26

(22 + 26) / 2 = 24

26 - 30

(26 + 30) / 2 = 28

30 и более

(30 + 34) / 2 = 32

Итого

Средние, вычисляемые из интервальных рядов являются приближенными.

  1. Структурные средние величины

Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и характеристики рядов распределения пользуются структурными средними: модой и медианой.

Мода - это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей.

Модой для дискретного ряда является варианта, обладающая наибольшей частотой.

При вычислении моды для интервального вариационного ряда необходимо:

    сначала определить модальный интервал (по максимальной частоте),

    затем - значение модальной величины признака по формуле:

Определение моды графически: Мода определяется по гистограмме распределения. Для этого

правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника - с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Медиана

Медиана - это значение признака, который делит вариационный ряд на две равные по численности части.

Медиана для дискретного ряда.

Для определения медианы в дискретном ряду с нечетным количеством единиц наблюдения сначалапорядковый номер медианы по формуле: , а затем определяют, какое значение варианта обладает накопленной частотой, равной номеру медианы.

Если ряд содержит четное число элементов, то медиана будет равна средней из двух значений признака, находящихся в середине. Номер первого из этих признаков определяется по формуле: , для второго - . = n (количество элементов в ряду).

Медиана для интервального ряда

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана.

Для этого:

Пример . Найти моду и медиану для интервального ряда.

Возрастные группы

Число студентов

Сумма накопленных частот ΣS

25 - 30

1054

2272

45 лет и более

Решение :

    Определим моду

В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).

Рассчитаем величину моды:

Это значит, что модальный возраст студентов равен 27 годам.

    Определим медиану.

Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σf i /2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:

Это значит, что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.

Графически медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует сумме всех частот, делят пополам. Через полученную точку

проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

Самым распространенным видом средней является средняя арифметическая.

Средняя арифметическая простая

Простая среднеарифметическая величина представляет собой среднее слагаемое, при определении которого общий объем данного признака в данных поровну распределяется между всеми единицами, входящими в данную совокупность. Так, среднегодовая выработка продукции на одного работающего — это такая величина объема продукции, которая приходилась бы на каждого работника, если бы весь объем выпущенной продукции в одинаковой степени распределялся между всеми сотрудниками организации. Среднеарифметическая простая величина исчисляется по формуле:

Простая средняя арифметическая — Равна отношению суммы индивидуальных значений признака к количеству признаков в совокупности

Пример 1. Бригада из 6 рабочих получает в месяц 3 3,2 3,3 3,5 3,8 3,1 тыс.руб.

Найти среднюю заработную плату
Решение: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 тыс. руб.

Средняя арифметическая взвешенная

Если объем совокупности данных большой и представляет собой ряд распределения, то исчисляется взвешенная среднеарифметическая величина. Так определяют средневзвешенную цену за единицу продукции: общую стоимость продукции (сумму произведений ее количества на цену единицы продукции) делят на суммарное количество продукции.

Представим это в виде следующей формулы:

Взвешенная средняя арифметическая — равна отношению (суммы произведений значения признака к частоте повторения данного признака) к (сумме частот всех признаков).Используется, когда варианты исследуемой совокупности встречаются неодинаковое количество раз.

Пример 2. Найти среднюю заработную плату рабочих цеха за месяц

Средняя заработная плата может быть получена путем деления общей суммы заработной платы на общее число рабочих:

Ответ: 3,35 тыс.руб.

Средняя арифметическая для интервального ряда

При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем — среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.

Средние, вычисляемые из интервальных рядов являются приближенными.

Пример 3 . Определить средний возраст студентов вечернего отделения.

Средние, вычисляемые из интервальных рядов являются приближенными. Степень их приближения зависит от того, в какой мере фактическое распределение единиц совокупности внутри интервала приближается к равномерному.

При расчете средних в качестве весов могут использоваться не только абсолютные, но и относительные величины (частость):

Средняя арифметическая обладает целым рядом свойств, которые более полно раскрывают ее сущность и упрощают расчет:

1. Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты, т.е.

2.Средняя арифметическая суммы варьирующих величин равна сумме средних арифметических этих величин:

3.Алгебраическая сумма отклонений индивидуальных значений признака от средней равна нулю:

4.Сумма квадратов отклонений вариантов от средней меньше, чем сумма квадратов отклонений от любой другой произвольной величины , т.е.