Среднее квадратичное отклонение информатика. Стандартное отклонение процентов. Что такое стандартное отклонение
Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от общей средней. В зависимости от исходных данных дисперсия может быть невзвешенной (простой) или взвешенной.
Дисперсия рассчитывается по следующим формулам:
· для несгруппированных данных
· для сгруппированных данных
Порядок расчета дисперсии взвешенную:
1. определяют среднюю арифметическую взвешенную
2. определяются отклонения вариант от средней
3. возводят в квадрат отклонение каждой варианты от средней
4. умножают квадраты отклонений на веса (частоты)
5. суммируют полученные произведения
6. полученную сумму делят на сумму весов
Формула для определения дисперсии может быть преобразована в следующую формулу:
Простая
Порядок расчета дисперсии простой:
1. определяют среднюю арифметическую
2. возводят в квадрат среднюю арифметическую
3. возводят в квадрат каждую варианту ряда
4. находим сумму квадратов вариант
5. делят сумму квадратов вариант на их число, т.е. определяют средний квадрат
6. определяют разность между средним квадратом признака и квадратом средней
Также формула для определения дисперсии взвешенной может быть преобразована в следующую формулу:
т.е. дисперсия равна разности средней из квадратов значений признака и квадрата средней арифметической. При пользовании преобразованной формулой исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от х и исключается ошибка в расчете, связанная с округлением отклонений
Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:
1) дисперсия постоянной величины равна нулю;
2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится;
3) если все варианты значений признака уменьшить в одно и то же число раз ( раз), то дисперсия уменьшится в раз
Среднее квадратичное отклонение S - представляет собой корень квадратный из дисперсии:
· для несгруппированных данных:
· для вариационного ряда:
Размах вариации, среднее линейное и среднее квадратичное отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.
Дисперсия и среднее квадратическое отклонение наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятности, служащей фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака.
Расчет показателей вариации для банков, сгруппированных по размеру прибыли, показан в таблице.
Размер прибыли, млн. руб. | Число банков | расчетные показатели | ||||
3,7 - 4,6 (-) | 4,15 | 8,30 | -1,935 | 3,870 | 7,489 | |
4,6 - 5,5 | 5,05 | 20,20 | - 1,035 | 4,140 | 4,285 | |
5,5 - 6,4 | 5,95 | 35,70 | - 0,135 | 0,810 | 0,109 | |
6,4 - 7,3 | 6,85 | 34,25 | +0,765 | 3,825 | 2,926 | |
7,3 - 8,2 | 7,75 | 23,25 | +1,665 | 4,995 | 8,317 | |
Итого: | 121,70 | 17,640 | 23,126 |
Среднее линейное и среднее квадратичное отклонение показывают на сколько в среднем колеблется величина признака у единиц и исследуемой совокупности. Так, в данном случае средняя величина колеблености размера прибыли составляет: по среднему линейному отклонению 0,882 млн. руб.; по среднему квадратическому отклонению - 1,075 млн. руб. Среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределение признака, близко к нормальному, то между S и d существует взаимосвязь: S=1,25d, или d=0,8S. Среднее квадратическое отклонение показывает как расположена основная масса единиц совокупности относительно средней арифметической. Независимо от формы распределения 75 значений признака попадают в интервал х 2S, а по крайне мере 89 всех значений попадают интервал х 3S (теорема П.Л.Чебышева).
18. Среднее квадратическое отклонение, методика расчета, значение.
Приближенный метод оценки колеблемости вариационного ряда - определение лимита и амплитуды, однако не учитывают значений вариант внутри ряда. Основной общепринятой мерой колеблемости количественного признака в пределах вариационного ряда является среднее квадратическое отклонение (σ - сигма) . Чем больше среднее квадратическое отклонение, тем степень колеблемости данного ряда выше.
Методика расчета среднего квадратического отклонения включает следующие этапы:
1. Находят среднюю арифметическую величину (Μ).
2. Определяют отклонения отдельных вариант от средней арифметической (d=V-M). В медицинской статистике отклонения от средней обозначаются как d (deviate). Сумма всех отклонений равняется нулю.
3. Возводят каждое отклонение в квадрат d 2 .
4. Перемножают квадраты отклонений на соответствующие частоты d 2 *p.
5. Находят сумму произведений (d 2 *p)
6. Вычисляют среднее квадратическое отклонение по формуле:
при n больше 30, или при n меньше либо равно 30, где n - число всех вариант.
Значение среднего квадратичного отклонения:
1. Среднее квадратическое отклонение характеризует разброс вариант относительно средней величины (т.е. колеблемость вариационного ряда). Чем больше сигма, тем степень разнообразия данного ряда выше.
2. Среднее квадратичное отклонение используется для сравнительной оценки степени соответствия средней арифметической величины тому вариационному ряду, для которого она вычислена.
Вариации массовых явлений подчиняются закону нормального распределения. Кривая, отображающая это распределение, имеет вид плавной колоколообразной симметричной кривой (кривая Гаусса). Согласно теории вероятности в явлениях, подчиняющихся закону нормального распределения, между значениями средней арифметической и среднего квадратического отклонения существует строгая математическая зависимость. Теоретическое распределение вариант в однородном вариационном ряду подчиняется правилу трех сигм.
Если в системе прямоугольных координат на оси абсцисс отложить значения количественного признака (варианты), а на оси ординат - частоты встречаемости вариант в вариационном ряду, то по сторонам от средней арифметической равномерно располагаются варианты с большими и меньшими значениями.
Установлено, что при нормальном распределении признака:
68,3% значений вариант находится в пределах М1
95,5% значений вариант находится в пределах М2
99,7% значений вариант находится в пределах М3
3. Среднее квадратическое отлонение позволяет установить значения нормы для клинико-биологических показателей. В медицине интервал М1 обычно принимается за пределы нормы для изучаемого явления. Отклонение оцениваемой величины от средней арифметической больше, чем на 1 указывает на отклонение изучаемого параметра от нормы.
4. В медицине правило трех сигм применяется в педиатрии для индивидуальной оценки уровня физического развития детей (метод сигмальных отклонений), для разработки стандартов детской одежды
5. Среднее квадратическое отклонение необходимо для характеристики степени разнообразия изучаемого признака и вычисления ошибки средней арифметической величины.
Величина среднего квадратического отклонения обычно используется для сравнения колеблемости однотипных рядов. Если сравниваются два ряда с разными признаками (рост и масса тела, средняя длительность лечения в стационаре и больничная летальность и т.д.), то непосредственное сопоставление размеров сигм невозможно, т.к. среднеквадратическое отклонение - именованная величина, выраженная в абсолютных числах. В этих случаях применяют коэффициент вариации (Cv) , представляющий собой относительную величину: процентное отношение среднего квадратического отклонения к средней арифметической.
Коэффициент вариации вычисляется по формуле:
Чем выше коэффициент вариации, тем большая изменчивость данного ряда. Считают, что коэффициент вариации свыше 30 % свидетельствует о качественной неоднородности совокупности.
" |
Математическое ожидание и дисперсия
Пусть мы измеряем случайную величину N раз, например, десять раз измеряем скорость ветра и хотим найти среднее значение. Как связано среднее значение с функцией распределения?
Будем кидать игральный кубик большое количество раз. Количество очков, которое выпадет на кубике при каждом броске, является случайной величиной и может принимать любые натуральные значения от 1 до 6. Среднее арифметическое выпавших очков, подсчитанных за все броски кубика, тоже является случайной величиной, однако при больших N оно стремится ко вполне конкретному числу – математическому ожиданию M x . В данном случае M x = 3,5.
Каким образом получилась эта величина? Пусть в N испытаниях раз выпало 1 очко, раз – 2 очка и так далее. Тогда При N → ∞ количество исходов, в которых выпало одно очко, Аналогично, Отсюда
Модель 4.5. Игральные кости
Предположим теперь, что мы знаем закон распределения случайной величины x , то есть знаем, что случайная величина x может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .
Математическое ожидание M x случайной величины x равно:
Ответ. 2,8.
Математическое ожидание не всегда является разумной оценкой какой-нибудь случайной величины. Так, для оценки средней заработной платы разумнее использовать понятие медианы, то есть такой величины, что количество людей, получающих меньшую, чем медиана, зарплату и большую, совпадают.
Медианой случайной величины называют число x 1/2 такое, что p (x < x 1/2) = 1/2.
Другими словами, вероятность p 1 того, что случайная величина x окажется меньшей x 1/2 , и вероятность p 2 того, что случайная величина x окажется большей x 1/2 , одинаковы и равны 1/2. Медиана определяется однозначно не для всех распределений.
Вернёмся к случайной величине x , которая может принимать значения x 1 , x 2 , ..., x k с вероятностями p 1 , p 2 , ..., p k .
Дисперсией случайной величины x называется среднее значение квадрата отклонения случайной величины от её математического ожидания:
Пример 2
В условиях предыдущего примера вычислить дисперсию и среднеквадратическое отклонение случайной величины x .
Ответ. 0,16, 0,4.
Модель 4.6. Стрельба в мишень
Пример 3
Найти распределение вероятности числа очков, выпавших на кубике с первого броска, медиану, математическое ожидание, дисперсию и среднеквадратичное отклонение.
Выпадение любой грани равновероятно, так что распределение будет выглядеть так:
Среднеквадратичное отклонение Видно, что отклонение величины от среднего значения очень велико.
Свойства математического ожидания:
- Математическое ожидание суммы независимых случайных величин равно сумме их математических ожиданий:
Пример 4
Найти математическое ожидание суммы и произведения очков, выпавшей на двух кубиках.
В примере 3 мы нашли, что для одного кубика M (x ) = 3,5. Значит, для двух кубиков
Свойства дисперсии:
- Дисперсия суммы независимых случайных величин равно сумме дисперсий:
D x + y = D x + D y .
Пусть за N бросков на кубике выпало y очков. Тогда
Этот результат верен не только для бросков кубика. Он во многих случаях определяет точность измерения математического ожидания опытным путем. Видно, что при увеличении количества измерений N разброс значений вокруг среднего, то есть среднеквадратичное отклонение, уменьшается пропорционально
Дисперсия случайной величины связана с математическим ожиданием квадрата этой случайной величины следующим соотношением:
Найдём математические ожидания обеих частей этого равенства. По определению,
Математическое же ожидание правой части равенства по свойству математических ожиданий равно
Среднее квадратическое отклонение
Среднеквадратическое отклонение
равно квадратному корню из дисперсии:
При определении среднего квадратического отклонения при достаточно большом объеме изучаемой совокупности (n > 30) применяются формулы:
Полученные из опыта величины неизбежно содержат погрешности, обусловленные самыми разнообразными причинами. Среди них следует различать погрешности систематические и случайные. Систематические ошибки обусловливаются причинами, действующими вполне определенным образом, и могут быть всегда устранены или достаточно точно учтены. Случайные ошибки вызываются весьма большим числом отдельных причин, не поддающихся точному учету и действующих в каждом отдельном измерении различным образом. Эти ошибки невозможно совершенно исключить; учесть же их можно только в среднем, для чего необходимо знать законы, которым подчиняются случайные ошибки.
Будем обозначать измеряемую величину через А, а случайную ошибку при измерении х. Так как ошибка х может принимать любые значения, то она является непрерывной случайной величиной, которая вполне характеризуется своим законом распределения.
Наиболее простым и достаточно точно отображающим действительность (в подавляющем большинстве случаев) является так называемый нормальный закон распределения ошибок :
Этот закон распределения может быть получен из различных теоретических предпосылок, в частности, из требования, чтобы наиболее вероятным значением неизвестной величины, для которой непосредственным измерением получен ряд значений с одинаковой степенью точности, являлось среднее арифметическое этих значений. Величина 2 называется дисперсией данного нормального закона.
Среднее арифметическое
Определение дисперсии по опытным данным. Если для какой-либо величины А непосредственным измерением получено n значений a i с одинаковой степенью точности и если ошибки величины А подчинены нормальному закону распределения, то наиболее вероятным значением А будет среднее арифметическое :
a - среднее арифметическое,
a i - измеренное значение на i-м шаге.
Отклонение наблюдаемого значения (для каждого наблюдения) a i величины А от среднего арифметического : a i - a.
Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой:
2 - дисперсия,
a - среднее арифметическое,
n - число измерений параметра,
Среднеквадратическое отклонение
Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического . В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле:
, где
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.
Коэффициент вариации
Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического :
, где
V - коэффициент вариации,
- среднеквадратическое отклонение,
a - среднее арифметическое.
Чем больше значение коэффициента вариации , тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений.
Среднее линейное отклонение
Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:
, где
_
a - среднее линейное отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.
Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке.
Показатель асимметрии
Показатель асимметрии (A) и его ошибка (m a) рассчитывается по следующим формулам:
, где
А - показатель асимметрии,
- среднеквадратическое отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.
Показатель эксцесса
Показатель эксцесса (E) и его ошибка (m e) рассчитывается по следующим формулам:
, где
Для расчетов средней геометрической простой используется формула:
Геометрическая взвешенная
Для определения средней геометрической взвешенной применяется формула:
редние диаметры колес, труб, средние стороны квадратов определяются при помощи средней квадратической.
Среднеквадратические величины используются для расчета некоторых показателей, например коэффициент вариации, характеризующего ритмичность выпуска продукции. Здесь определяют среднеквадратическое отклонение от планового выпуска продукции за определенный период по следующей формуле:
Эти величины точно характеризуют изменение экономических показателей по сравнению с их базисной величиной, взятое в его усредненной величине.
Квадратическая простая
Средняя квадратическая простая вычисляется по формуле:
Квадратическая взвешенная
Средняя квадратическая взвешенная равна:
22. Абсолютные показатели вариации включают:
размах вариации
среднее линейное отклонение
дисперсию
среднее квадратическое отклонение
Размах вариации (r)
Размах вариации - это разность между максимальным и минимальным значениями признака
Он показывает пределы, в которых изменяется величина признака в изучаемой совокупности.
Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет. Решение: размах вариации = 9 - 2 = 7 лет.
Для обобщенной характеристики различий в значениях признака вычисляют средние показатели вариации, основанные на учете отклонений от средней арифметической. За отклонение от средней принимается разность .
При этом во избежании превращения в нуль суммы отклонений вариантов признака от средней (нулевое свойство средней) приходится либо не учитывать знаки отклонения, то есть брать эту сумму по модулю , либо возводить значения отклонений в квадрат
Среднее линейное и квадратическое отклонение
Среднее линейное отклонение - этосредняя арифметическая из абсолютных отклонений отдельных значений признака от средней.
Среднее линейное отклонение простое:
Опыт работы у пяти претендентов на предшествующей работе составляет: 2,3,4,7 и 9 лет.
В нашем примере: лет;
Ответ: 2,4 года.
Среднее линейное отклонение взвешенное применяется для сгруппированных данных:
Среднее линейное отклонение в силу его условности применяется на практике сравнительно редко (в частности, для характеристики выполнения договорных обязательств по равномерности поставки; в анализе качества продукции с учетом технологических особенностей производства).
Среднее квадратическое отклонение
Наиболее совершенной характеристикой вариации является среднее квадратическое откложение, которое называют стандартом (или стандартным отклонение). Среднее квадратическое отклонение () равно квадратному корню из среднего квадрата отклонений отдельных значений признака отсредней арифметической:
Среднее квадратическое отклонение простое:
Среднее квадратическое отклонение взвешенное применяется для сгруппированных данных:
Между средним квадратическим и средним линейным отклонениями в условиях нормального распределения имеет место следующее соотношение: ~ 1,25.
Среднее квадратическое отклонение, являясь основной абсолютной мерой вариации, используется при определении значений ординат кривой нормального распределения, в расчетах, связанных с организацией выборочного наблюдения и установлением точности выборочных характеристик, а также при оценке границ вариации признака в однородной совокупности.