Намерете дисперсията и стандартното отклонение. Изчисляване на стандартно отклонение в Microsoft Excel

  • Отговори на изпитни въпроси по обществено здраве и здравеопазване.
  • 1. Общественото здраве и здравеопазването като наука и област на практическа дейност. Основни цели. Обект, предмет на изследване. Методи.
  • 2. Здравеопазване. Определение. История на развитието на здравеопазването. Съвременни здравни системи, техните характеристики.
  • 3. Държавна политика в областта на опазването на общественото здраве (Закон на Република Беларус „За здравеопазването“). Организационни принципи на системата на общественото здравеопазване.
  • 4. Осигуряване и частни форми на здравеопазване.
  • 5. Профилактика, определение, принципи, съвременни проблеми. Видове, нива, направления на профилактика.
  • 6. Национални програми за превенция. Тяхната роля за подобряване на общественото здраве.
  • 7. Медицинска етика и деонтология. Дефиниция на понятието. Съвременни проблеми на медицинската етика и деонтология, характеристики.
  • 8. Здравословен начин на живот, определение на понятието. Социални и медицински аспекти на здравословния начин на живот (здравословен начин на живот).
  • 9. Хигиенно обучение и възпитание, определение, основни принципи. Методи и средства за хигиенно обучение и възпитание. Изисквания към лекцията, санитарен бюлетин.
  • 10. Здраве на населението, фактори, влияещи върху общественото здраве. Здравна формула. Показатели, характеризиращи общественото здраве. Схема за анализ.
  • 11. Демографията като наука, определение, съдържание. Значението на демографските данни за здравеопазването.
  • 12. Статистика на населението, методи на изследване. Преброявания на населението. Видове възрастови структури на населението.
  • 13. Механично движение на населението. Характеристика на миграционните процеси, влиянието им върху здравните показатели на населението.
  • 14. Плодовитостта като медико-социален проблем. Методика за изчисляване на показателите. Нива на плодовитост по данни на СЗО. Съвременни тенденции.
  • 15. Специални показатели за плодовитост (показатели за плодовитост). Възпроизводство на населението, видове възпроизводство. Показатели, методи за изчисляване.
  • 16. Смъртността като медико-социален проблем. Методология на изследването, индикатори. Нива на обща смъртност по данни на СЗО. Съвременни тенденции.
  • 17. Детската смъртност като медико-социален проблем. Фактори, определящи нивото му.
  • 18. Майчина и перинатална смъртност, основни причини. Показатели, методи за изчисляване.
  • 19. Естествено движение на населението, фактори, влияещи върху него. Показатели, методи за изчисляване. Основни модели на естественото движение в Беларус.
  • 20. Семейно планиране. Определение. Съвременни проблеми. Медицински организации и услуги по семейно планиране в Република Беларус.
  • 21. Заболеваемостта като медико-социален проблем. Съвременни тенденции и особености в Република Беларус.
  • 22. Медико-социални аспекти на нервно-психическото здраве на населението. Организация на психоневрологичната помощ
  • 23. Алкохолизмът и наркоманията като медико-социален проблем
  • 24. Болестите на органите на кръвообращението като медико-социален проблем. Рискови фактори. Насоки за превенция. Организация на кардиологичните грижи.
  • 25. Злокачествените новообразувания като медико-социален проблем. Основни направления на превенцията. Организация на онкологичната помощ.
  • 26. Международна статистическа класификация на болестите. Принципи на изграждане, ред за използване. Значението му в изследването на заболеваемостта и смъртността на населението.
  • 27. Методи за изследване на заболеваемостта на населението, тяхната сравнителна характеристика.
  • Методика за изследване на общата и първична заболеваемост
  • Показатели за обща и първична заболеваемост.
  • Показатели за инфекциозна заболеваемост.
  • Основни показатели, характеризиращи най-важната неепидемична заболеваемост.
  • Основни показатели за „хоспитализирана” заболеваемост:
  • 4) Заболявания с временна нетрудоспособност (въпрос 30)
  • Основни показатели за анализ на заболеваемостта с ВУТ.
  • 31. Проучване на заболеваемостта по профилактични прегледи на населението, видове профилактични прегледи, ред. Здравни групи. Концепцията за "патологична привързаност".
  • 32. Заболеваемост по данни за причините за смъртта. Методология на изследването, индикатори. Медицински акт за смърт.
  • Основни показатели за заболеваемост въз основа на причините за смъртта:
  • 33. Инвалидността като медико-социален проблем Дефиниране на понятието, индикатори. Тенденции в областта на инвалидността в Република Беларус.
  • Тенденции в областта на инвалидността в Република Беларус.
  • 34. Първична здравна помощ (ПМСП), определение, съдържание, роля и място в системата на здравеопазването на населението. Основни функции.
  • 35. Основни принципи на първичната здравна помощ. Медицински организации на първичната здравна помощ.
  • 36. Организация на амбулаторното медицинско обслужване на населението. Основни принципи. институции.
  • 37. Организация на медицинското обслужване в болнични условия. институции. Индикатори за предоставяне на болнична помощ.
  • 38. Видове медицински грижи. Организиране на специализирана медицинска помощ за населението. Центрове за специализирана медицинска помощ, техните задачи.
  • 39. Основни насоки за подобряване на болничната и специализирана помощ в Република Беларус.
  • 40. Защита на здравето на жените и децата в Република Беларус. контрол. Медицински организации.
  • 41. Съвременни проблеми на женското здраве. Организация на акушерската и гинекологичната помощ в Република Беларус.
  • 42. Организация на лечебно-профилактични грижи за деца. Водещи проблеми в детското здраве.
  • 43. Организация на здравеопазването на селското население, основни принципи за предоставяне на медицинска помощ на селските жители. Етапи. организации.
  • II етап – териториално лекарско дружество (ТМО).
  • III етап – районна болница и районни лечебни заведения.
  • 45. Медико-социална експертиза (МСЕ), определение, съдържание, основни понятия.
  • 46. ​​​​Рехабилитация, определение, видове. Закон на Република Беларус „За превенция на инвалидността и рехабилитация на хора с увреждания“.
  • 47. Медицинска рехабилитация: определение на понятието, етапи, принципи. Услуги за медицинска рехабилитация в Република Беларус.
  • 48. Градска клиника, структура, задачи, управление. Основни показатели за ефективност на клиниката.
  • Основни показатели за ефективност на клиниката.
  • 49. Местният принцип за организиране на извънболнична помощ за населението. Видове парцели. Териториална терапевтична зона. Стандарти. Съдържание на работата на местния лекар-терапевт.
  • Организация на работата на местен терапевт.
  • 50. Кабинет по инфекциозни болести на клиниката. Раздели и методи на работа на лекар в кабинета по инфекциозни болести.
  • 52. Основни показатели, характеризиращи качеството и ефективността на диспансерното наблюдение. Метод на тяхното изчисляване.
  • 53. Отдел за медицинска рехабилитация (MR) на клиниката. Структура, задачи. Процедурата за насочване на пациенти към OMR.
  • 54. Детска клиника, структура, задачи, раздели на работа. Характеристики на предоставяне на медицинска помощ за деца в амбулаторни условия.
  • 55. Основните раздели на работата на местния педиатър. Съдържание на лечебно-профилактична работа. Комуникация при работа с други лечебно-профилактични институции. Документация.
  • 56. Съдържание на превантивната работа на местния педиатър. Организация на сестрински грижи за новородени.
  • 57. Структура, организация, съдържание на работата на предродилната консултация. Показатели за работа по обслужване на бременни жени. Документация.
  • 58. Родилен дом, структура, организация на работа, управление. Показатели за работа на родилния дом. Документация.
  • 59. Градска болница, нейните задачи, структура, основни показатели за изпълнение. Документация.
  • 60. Организация на работата на приемното отделение на болницата. Документация. Мерки за предотвратяване на вътреболничните инфекции. Лечебно-протективен режим.
  • Раздел 1. Информация за поделенията и инсталациите на лечебно-профилактичната организация.
  • Раздел 2. Персонал на организацията за лечение и профилактика в края на отчетната година.
  • Раздел 3. Работа на лекарите на клиниката (амбулатория), диспансер, консултации.
  • Раздел 4. Превантивни медицински прегледи и работа на стоматологични (стоматологични) и хирургични кабинети на лечебно-профилактична организация.
  • Раздел 5. Работа на медицински и помощни отделения (кабинети).
  • Раздел 6. Работа на диагностичните отделения.
  • 62. Годишен отчет за дейността на болницата (форма 14), ред за изготвяне, структура. Основни показатели за дейността на болницата.
  • Раздел 1. Състав на пациентите в болницата и резултатите от тяхното лечение
  • Раздел 2. Състав на болни новородени, прехвърлени в други болници на възраст 0-6 дни и резултатите от тяхното лечение
  • Раздел 3. Легловата база и нейното използване
  • Раздел 4. Хирургична работа на болницата
  • 63. Отчет за медицински грижи за бременни жени, родилки и родилки (ф. 32), структура. Основни показатели.
  • Раздел I. Дейност на предродилната консултация.
  • Раздел II. Акушерство в болница
  • Раздел III. Майчина смъртност
  • Раздел IV. Информация за раждания
  • 64. Медицинско генетично консултиране, основни институции. Ролята му в превенцията на перинаталната и детската смъртност.
  • 65. Медицинска статистика, нейните раздели, задачи. Ролята на статистическия метод в изследването на здравето на населението и работата на здравната система.
  • 66. Статистическа съвкупност. Определение, видове, свойства. Характеристики на провеждане на статистически изследвания върху извадкова съвкупност.
  • 67. Извадкова съвкупност, изисквания към нея. Принципът и методите за формиране на извадкова съвкупност.
  • 68. Единица за наблюдение. Определение, характеристики на счетоводните характеристики.
  • 69. Организация на статистическите изследвания. Характеристики на етапите.
  • 70. Съдържание на плана и програмата на статистическото изследване. Видове планове за статистически изследвания. Програма за наблюдение.
  • 71. Статистическо наблюдение. Непрекъснати и непродължителни статистически изследвания. Видове непълни статистически изследвания.
  • 72. Статистическо наблюдение (събиране на материали). Грешки в статистическото наблюдение.
  • 73. Статистическо групиране и обобщение. Типологично и вариационно групиране.
  • 74. Статистически таблици, видове, изисквания за изграждане.

81. Стандартно отклонение, метод на изчисление, приложение.

Приблизителен метод за оценка на променливостта на вариационна серия е да се определи границата и амплитудата, но стойностите на варианта в серията не се вземат предвид. Основната общоприета мярка за променливостта на количествена характеристика в рамките на вариационна серия е стандартно отклонение (σ - сигма). Колкото по-голямо е стандартното отклонение, толкова по-висока е степента на флуктуация на тази серия.

Методът за изчисляване на стандартното отклонение включва следните стъпки:

1. Намерете средното аритметично (M).

2. Определяне на отклоненията на отделните варианти от средноаритметичното (d=V-M). В медицинската статистика отклоненията от средната стойност се означават с d (deviate). Сумата от всички отклонения е нула.

3. Квадратирайте всяко отклонение d 2.

4. Умножете квадратите на отклоненията по съответните честоти d 2 *p.

5. Намерете сумата от произведенията (d 2 *p)

6. Изчислете стандартното отклонение по формулата:

когато n е по-голямо от 30, или
когато n е по-малко или равно на 30, където n е броят на всички опции.

Стойност на стандартното отклонение:

1. Стандартното отклонение характеризира разпространението на варианта спрямо средната стойност (т.е. променливостта на серията от варианти). Колкото по-голяма е сигмата, толкова по-висока е степента на разнообразие на тази серия.

2. Стандартното отклонение се използва за сравнителна оценка на степента на съответствие на средната аритметична стойност с вариационната серия, за която е изчислена.

Вариациите на масовите явления се подчиняват на закона за нормалното разпределение. Кривата, представяща това разпределение, изглежда като гладка симетрична крива с форма на камбана (крива на Гаус). Според теорията на вероятностите при явления, които се подчиняват на закона за нормалното разпределение, съществува строга математическа зависимост между стойностите на средното аритметично и стандартното отклонение. Теоретичното разпределение на вариант в хомогенна вариационна серия се подчинява на правилото на трите сигми.

Ако в система от правоъгълни координати стойностите на количествена характеристика (варианти) са нанесени на абсцисната ос, а честотата на поява на вариант в вариационна серия е нанесена на ординатната ос, тогава вариантите с по-големи и по-малки стойностите са равномерно разположени отстрани на средноаритметичната стойност.

Установено е, че при нормално разпределение на признака:

68,3% от стойностите на опцията са в рамките на M1

95,5% от стойностите на опцията са в рамките на M2

99,7% от стойностите на опцията са в рамките на M3

3. Стандартното отклонение ви позволява да установите нормални стойности за клинични и биологични параметри. В медицината интервалът M1 обикновено се приема като нормален диапазон за изследваното явление. Отклонението на изчислената стойност от средноаритметичната с повече от 1 показва отклонение на изследвания параметър от нормата.

4. В медицината правилото на трите сигми се използва в педиатрията за индивидуална оценка на нивото на физическо развитие на децата (метод на сигма отклонение), за разработване на стандарти за детско облекло

5. Стандартното отклонение е необходимо за характеризиране на степента на разнообразие на изследваната характеристика и за изчисляване на грешката на средната аритметична стойност.

Стойността на стандартното отклонение обикновено се използва за сравняване на променливостта на серии от същия тип. Ако се сравнят две серии с различни характеристики (ръст и тегло, средна продължителност на болнично лечение и болнична смъртност и др.), тогава директното сравнение на сигма размерите е невъзможно , защото стандартното отклонение е наименована стойност, изразена в абсолютни числа. В тези случаи използвайте коефициентът на вариация (Cv) , което е относителна стойност: процентното съотношение на стандартното отклонение към средното аритметично.

Коефициентът на вариация се изчислява по формулата:

Колкото по-висок е коефициентът на вариация , толкова по-голяма е променливостта на тази серия. Смята се, че коефициент на вариация над 30% показва качествената хетерогенност на популацията.

Стандартно отклонение(синоними: стандартно отклонение, стандартно отклонение, квадратно отклонение; свързани термини: стандартно отклонение, стандартен спред) - в теорията на вероятностите и статистиката, най-често срещаният индикатор за дисперсията на стойностите на случайна променлива спрямо нейното математическо очакване. За ограничени масиви от примерни стойности, вместо математическо очакванеизползва се средноаритметичната стойност на извадката от съвкупността.

Енциклопедичен YouTube

  • 1 / 5

    Стандартното отклонение се измерва в самите мерни единици случайна величинаи се използва при изчисляване на стандартната грешка на средната аритметична стойност, при конструиране на доверителни интервали, при статистическа проверка на хипотези, при измерване на линейната връзка между случайни променливи. Дефинира се като корен квадратен от дисперсията на случайна променлива.

    Стандартно отклонение:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac (n)(n-1))\sigma ^(2)))=(\sqrt ((\frac (1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Забележка: Много често има несъответствия в имената на MSD (средно квадратно отклонение) и STD (стандартно отклонение) с техните формули. Например в модула numPy на езика за програмиране Python функцията std() е описана като "стандартно отклонение", докато формулата отразява стандартното отклонение (деление на корена на извадката). В Excel функцията STANDARDEVAL() е различна (деление по корен от n-1).

    Стандартно отклонение(оценка на стандартното отклонение на случайна променлива хспрямо неговото математическо очакване въз основа на безпристрастна оценка на неговата дисперсия) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar (x))\right) ^(2))).)

    Където σ 2 (\displaystyle \sigma ^(2))- дисперсия; x i (\displaystyle x_(i)) - азелемент на селекцията; n (\displaystyle n)- размер на извадката; - средно аритметично от извадката:

    x ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\lточки +x_(n)).)

    Трябва да се отбележи, че и двете оценки са пристрастни. В общия случай е невъзможно да се изгради безпристрастна оценка. Въпреки това оценката, базирана на безпристрастната оценка на дисперсията, е последователна.

    В съответствие с GOST R 8.736-2011 стандартното отклонение се изчислява по втората формула на този раздел. Моля, проверете резултатите.

    Правилото на трите сигми

    Правилото на трите сигми (3 σ (\displaystyle 3\sigma )) - почти всички стойности на нормално разпределена случайна променлива лежат в интервала (x ¯ − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). По-строго - с приблизително вероятност 0,9973, стойността на нормално разпределена случайна променлива се намира в посочения интервал (при условие, че стойността x ¯ (\displaystyle (\bar (x)))вярно, а не получено в резултат на обработка на пробата).

    Ако истинската стойност x ¯ (\displaystyle (\bar (x)))е неизвестен, тогава не трябва да използвате σ (\displaystyle \sigma ), А с. Така правилото на трите сигми се трансформира в правилото на трите с .

    Интерпретация на стойността на стандартното отклонение

    По-голямата стойност на стандартното отклонение показва по-голямо разпространение на стойностите в представения набор със средната стойност на набора; по-малка стойност, съответно, показва, че стойностите в набора са групирани около средната стойност.

    Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). И трите набора имат средни стойности, равни на 7, и стандартни отклонения, съответно равни на 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият набор има най-много голямо значениестандартно отклонение - стойностите в рамките на набора се различават значително от средната стойност.

    В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на серия от последователни измервания на някакво количество. Тази стойност е много важна за определяне на правдоподобността на изследваното явление в сравнение със стойността, предвидена от теорията: ако средната стойност на измерванията се различава значително от стойностите, предвидени от теорията (голямо стандартно отклонение), тогава получените стойности или методът за получаването им трябва да бъдат проверени отново. идентифицирани с портфейлния риск.

    Климат

    Да предположим, че има два града с еднаква средна максимална дневна температура, но единият е разположен на брега, а другият в равнината. Известно е, че градовете, разположени на брега, имат много различни максимални дневни температури, които са по-ниски от градовете, разположени във вътрешността. Следователно стандартното отклонение на максималните дневни температури за крайбрежен град ще бъде по-малко, отколкото за втори град, въпреки факта, че средната им стойност е една и съща, което на практика означава, че вероятността, че Максимална температуравъздух за всеки конкретен ден от годината ще се различава по-силно от средната стойност, по-висока за град, разположен вътре в континента.

    спорт

    Да приемем, че има няколко футболни отбора, които са оценени по някакъв набор от параметри, например брой отбелязани и допуснати голове, шансове за гол и т.н. Най-вероятно е най-добрият отбор в тази група да има по-добри стойности по повече параметри. Колкото по-малко е стандартното отклонение на екипа за всеки от представените параметри, толкова по-предвидим е резултатът на отбора; такива екипи са балансирани. От друга страна, отбор с голямо стандартно отклонение трудно може да предвиди резултата, което от своя страна се обяснява с дисбаланс, например силна защита, но слаба атака.

    Използването на стандартното отклонение на отборните параметри дава възможност в една или друга степен да се прогнозира резултатът от мач между два отбора, като се преценят силните страни и слаби страникоманди, а следователно и избраните методи на борба.

    Един от основните инструменти на статистическия анализ е изчисляването на стандартното отклонение. Този индикатор ви позволява да оцените стандартното отклонение за извадка или за популация. Нека научим как да използваме формулата за стандартно отклонение в Excel.

    Нека веднага да определим какво е стандартното отклонение и как изглежда формулата му. Тази стойност е корен квадратен от средната стойност аритметично числоквадрати на разликата между всички стойности на серията и тяхната средна аритметична стойност. Има идентично име за този индикатор - стандартно отклонение. И двете имена са напълно равностойни.

    Но, естествено, в Excel потребителят не трябва да изчислява това, тъй като програмата прави всичко за него. Нека научим как да изчисляваме стандартното отклонение в Excel.

    Изчисляване в Excel

    Можете да изчислите посочената стойност в Excel с помощта на две специални функции STDEV.V(въз основа на извадката) и STDEV.G(въз основа на общата съвкупност). Принципът на тяхното действие е абсолютно същият, но те могат да бъдат извикани по три начина, които ще разгледаме по-долу.

    Метод 1: Съветник за функции


    Метод 2: Раздел Формули


    Метод 3: Ръчно въвеждане на формулата

    Има и начин, по който изобщо няма да е необходимо да извиквате прозореца на аргументите. За да направите това, трябва да въведете формулата ръчно.


    Както можете да видите, механизмът за изчисляване на стандартното отклонение в Excel е много прост. Потребителят трябва само да въведе числа от популацията или препратки към клетките, които ги съдържат. Всички изчисления се извършват от самата програма. Много по-трудно е да се разбере какъв е изчисленият показател и как резултатите от изчислението могат да се приложат на практика. Но разбирането на това вече е свързано повече с областта на статистиката, отколкото с обучението за работа със софтуер.

    Урок №4

    Тема: „Описателна статистика. Индикатори за разнообразие на признаци в съвкупността"

    Основните критерии за разнообразието на даден признак в статистическа съвкупност са: граница, амплитуда, стандартно отклонение, коефициент на осцилация и коефициент на вариация. В предишния урок беше обсъдено, че средните стойности предоставят само обобщена характеристика на характеристиката, която се изучава в съвкупност, и не вземат предвид стойностите на нейните отделни варианти: минимални и максимални стойности, над средното, под средно и т.н.

    Пример. Средни стойности на две различни числови последователности: -100; -20; 100; 20 и 0,1; -0,2; 0,1 са абсолютно еднакви и равниОТНОСНО.Въпреки това диапазоните на разсейване на тези данни за относителна средна последователност са много различни.

    Определянето на изброените критерии за разнообразието на дадена характеристика се извършва преди всичко, като се вземе предвид нейната стойност в отделни елементи на статистическата съвкупност.

    Индикаторите за измерване на вариациите на даден признак са абсолютенИ роднина. Абсолютните показатели за вариация включват: диапазон на вариация, граница, стандартно отклонение, дисперсия. Коефициентът на вариация и коефициентът на колебание се отнасят до относителни мерки за вариация.

    Лимит (lim)–Това е критерий, който се определя от екстремните стойности на вариант в серия от варианти. С други думи, този критерий е ограничен от минималните и максималните стойности на атрибута:

    Амплитуда (Am)или диапазон на вариация –Това е разликата между екстремните варианти. Изчисляването на този критерий се извършва чрез изваждане на минималната му стойност от максималната стойност на атрибута, което ни позволява да оценим степента на разсейване на опцията:

    Недостатъкът на границата и амплитудата като критерии за променливост е, че те напълно зависят от екстремните стойности на характеристиката в вариационната серия. В този случай колебанията в стойностите на атрибутите в рамките на серия не се вземат предвид.

    Най-пълното описание на разнообразието на признак в статистическа съвкупност се предоставя от стандартно отклонение(сигма), което е обща мярка за отклонението на дадена опция от нейната средна стойност. Често се нарича стандартно отклонение стандартно отклонение.

    Стандартното отклонение се основава на сравнение на всяка опция със средната аритметична стойност на дадена популация. Тъй като в съвкупността винаги ще има опции както по-малко, така и повече от него, сумата от отклонения със знак "" ще се анулира от сумата от отклонения със знак "", т.е. сумата от всички отклонения е нула. За да се избегне влиянието на знаците на разликите, се вземат отклонения от средноаритметичното на квадрат, т.е. . Сумата от квадратите на отклоненията не е равна на нула. За да получите коефициент, който може да измерва променливостта, вземете средната стойност на сумата от квадрати - тази стойност се нарича отклонения:

    По същество дисперсията е средният квадрат на отклоненията на отделните стойности на дадена характеристика от нейната средна стойност. дисперсия квадрат на стандартното отклонение.

    Дисперсията е размерно количество (наименувано). Така че, ако вариантите на числова серия са изразени в метри, тогава дисперсията дава квадратни метри; ако опциите са изразени в килограми, тогава дисперсията дава квадрата на тази мярка (kg 2) и т.н.

    Стандартно отклонениеКорен квадратенот дисперсия:

    , тогава при изчисляване на дисперсията и стандартното отклонение в знаменателя на дробта, вместотрябва да се постави.

    Изчисляването на стандартното отклонение може да бъде разделено на шест етапа, които трябва да се извършват в определена последователност:

    Приложение на стандартното отклонение:

    а) за преценка на променливостта на вариационните серии и сравнителна оценка на типичността (представителността) на средните аритметични стойности. Това е необходимо при диференциална диагноза при определяне на стабилността на симптомите.

    б) да се реконструира вариационната серия, т.е. възстановяване на неговата честотна характеристика въз основа на три сигма правила. В интервала (М±3σ) 99,7% от всички варианти на серията се намират в интервала (М±2σ) - 95,5% и в диапазона (М±1σ) - 68,3% редов вариант(Фиг. 1).

    в) за идентифициране на „изскачащи“ опции

    г) да се определят параметрите на нормата и патологията с помощта на сигма оценки

    д) да се изчисли коефициентът на вариация

    е) да се изчисли средната грешка на средноаритметичното.

    За да се характеризира всяка популация, която иманормален тип разпределение , достатъчно е да знаете два параметъра: средно аритметично и стандартно отклонение.

    Фигура 1. Правило на трите сигми

    Пример.

    В педиатрията стандартното отклонение се използва за оценка на физическото развитие на децата чрез сравняване на данните за конкретно дете със съответните стандартни показатели. За стандарт се приема средноаритметичното на физическото развитие на здрави деца. Сравнението на показателите със стандартите се извършва с помощта на специални таблици, в които стандартите са дадени заедно със съответните им сигма скали. Смята се, че ако показателят за физическото развитие на детето е в рамките на стандарта (средно аритметично) ±σ, тогава физическото развитие на детето (според този показател) съответства на нормата. Ако индикаторът е в рамките на стандарта ±2σ, тогава има леко отклонение от нормата. Ако индикаторът надхвърли тези граници, тогава физическото развитие на детето се различава рязко от нормата (възможна е патология).

    В допълнение към вариационните показатели, изразени в абсолютни стойности, статистическите изследвания използват вариационни показатели, изразени в относителни стойности. Коефициент на трептене -това е отношението на диапазона на вариация към средната стойност на признака. Коефициентът на вариация -това е отношението на стандартното отклонение към средната стойност на характеристиката. Обикновено тези стойности се изразяват като проценти.

    Формули за изчисляване на показателите за относителна вариация:

    От горните формули става ясно, че колкото по-голям е коеф V е по-близо до нула, толкова по-малка е вариацията в стойностите на характеристиката. Колкото повече V, толкова по-променлив е знакът.

    В статистическата практика най-често се използва коефициентът на вариация. Използва се не само за сравнителна оценка на вариацията, но и за характеризиране на хомогенността на популацията. Популацията се счита за хомогенна, ако коефициентът на вариация не надвишава 33% (за разпределения, близки до нормалните). Аритметично съотношението на σ и средноаритметичното неутрализира влиянието на абсолютната стойност на тези характеристики, а процентното съотношение прави коефициента на вариация безразмерна (неназована) стойност.

    Получената стойност на коефициента на вариация се оценява в съответствие с приблизителните градации на степента на разнообразие на признака:

    Слаб - до 10%

    Средно - 10 - 20%

    Силен - повече от 20%

    Използването на коефициента на вариация е препоръчително в случаите, когато е необходимо да се сравнят характеристики, които са различни по размер и размер.

    Разликата между коефициента на вариация и други критерии за разсейване е ясно демонстрирана пример.

    маса 1

    Състав на работниците в промишленото предприятие

    Въз основа на статистическите характеристики, дадени в примера, можем да направим заключение за относителната хомогенност на възрастовия състав и образователното ниво на служителите на предприятието, като се има предвид ниската професионална стабилност на анкетирания контингент. Лесно е да се види, че опитът да се преценят тези социални тенденции чрез стандартното отклонение би довел до погрешно заключение, а опитът да се сравнят счетоводните характеристики „трудов опит“ и „възраст“ със счетоводния показател „образование“ като цяло би бил неправилно поради разнородността на тези характеристики.

    Медиана и процентили

    За ординални (рангови) разпределения, където критерият за средата на реда е медианата, стандартното отклонение и дисперсията не могат да служат като характеристики на дисперсията на варианта.

    Същото важи и за отворените вариационни серии. Това обстоятелство се дължи на факта, че отклоненията, от които се изчисляват дисперсията и σ, се измерват от средната аритметична стойност, която не се изчислява в отворени вариационни серии и в серии от разпределения на качествени характеристики. Следователно, за компресирано описание на разпределения се използва друг параметър на разсейване - квантил(синоним - „процентил“), подходящ за описание на качествени и количествени характеристики във всякаква форма на тяхното разпределение. Този параметър може да се използва и за преобразуване на количествени характеристики в качествени. В този случай такива рейтинги се присвояват в зависимост от това на кой ред от квантил отговаря дадена опция.

    В практиката на биомедицинските изследвания най-често се използват следните квантили:

    - Медиана;

    , – квартили (четвърти), където – долен квартил, горен квартил.

    Квантилите разделят областта на възможните промени в вариационна серия на определени интервали. Медиана (квантил) е опция, която е в средата на вариационна серия и разделя тази серия наполовина на две равни части ( 0,5 И 0,5 ). Квартилът разделя серия на четири части: първата част (долният квартил) е опция, която разделя опции, чиито числени стойности не надвишават 25% от максимално възможните в дадена серия; квартилът разделя опциите с числена стойност от до 50% от максимално възможния. Горният квартил () разделя опциите до 75% от максимално възможните стойности.

    При асиметрично разпределение променлива спрямо средната аритметична стойност, медианата и квартилите се използват за нейното характеризиране.В този случай се използва следната форма за показване на средната стойност - мех (;). Например, изследваният признак – „периодът, в който детето започва да ходи самостоятелно” – има асиметрично разпределение в изследваната група. В същото време долният квартил () съответства на началото на ходенето - 9,5 месеца, медианата - 11 месеца, горният квартил () - 12 месеца. Съответно, характеристиката на средния тренд на посочения признак ще бъде представена като 11 (9,5; 12) месеца.

    Оценка на статистическата значимост на резултатите от изследването

    Статистическата значимост на данните се разбира като степента, в която те съответстват на показаната реалност, т.е. статистически значими данни са тези, които не изкривяват и правилно отразяват обективната реалност.

    Оценяването на статистическата значимост на резултатите от изследването означава да се определи с каква вероятност е възможно резултатите, получени от извадката от съвкупността, да се прехвърлят към цялата популация. Оценката на статистическата значимост е необходима, за да се разбере каква част от дадено явление може да се използва, за да се прецени явлението като цяло и неговите модели.

    Оценката на статистическата значимост на резултатите от изследването се състои от:

    1. грешки на представителността (грешки на средни и относителни стойности) - м;

    2. доверителни граници на средни или относителни стойности;

    3. надеждност на разликата в средните или относителните стойности според критерия T.

    Стандартна грешка на средноаритметичната стойностили грешка в представителносттахарактеризира колебанията на средната стойност. Трябва да се отбележи, че колкото по-голям е размерът на извадката, толкова по-малък е разпределението на средните стойности. Стандартната грешка на средната стойност се изчислява по формулата:

    В съвременната научна литература средноаритметичната стойност се записва заедно с грешката на представителност:

    или заедно със стандартното отклонение:

    Като пример разгледайте данните за 1500 градски клиники в страната (общо население). Средният брой обслужени пациенти в клиниката е 18 150 души. Случайният избор на 10% от обектите (150 клиники) дава среден брой пациенти, равен на 20 051 души. Грешката на извадката, очевидно поради факта, че не всички 1500 клиники са включени в извадката, е равна на разликата между тези средни стойности - общата средна ( Мген) и средно извадка ( Мизбран). Ако формираме друга извадка със същия размер от нашата популация, това ще даде различна стойност на грешката. Всички тези извадкови средни с достатъчно големи извадки се разпределят нормално около генералната средна с достатъчно голям брой повторения на извадката от същия брой обекти от генералната съвкупност. Стандартна грешка на средната стойност м- това е неизбежното разпръскване на извадковите средни около генералното средно.

    В случай, че резултатите от изследването са представени в относителни количества (например проценти) - изчислени стандартна грешка на дроб:

    където P е показателят в %, n е броят на наблюденията.

    Резултатът се показва като (P ± m)%. Например,процентът на възстановяване сред пациентите е (95,2±2,5)%.

    В случай, че броят на елементите на съвкупността, тогава при изчисляване на стандартните грешки на средната стойност и дробта в знаменателя на дробта, вместотрябва да се постави.

    За нормално разпределение (разпределението на извадковите средни стойности е нормално), знаем каква част от съвкупността попада във всеки интервал около средната стойност. В частност:

    На практика проблемът е, че характеристиките на генералната съвкупност са ни непознати и извадката се прави именно с цел да ги оценим. Това означава, че ако направим проби с еднакъв размер нот общата популация, тогава в 68,3% от случаите интервалът ще съдържа стойността М(в 95,5% от случаите ще бъде на интервала и в 99,7% от случаите – на интервала).

    Тъй като всъщност е взета само една извадка, това твърдение е формулирано по отношение на вероятността: с вероятност от 68,3%, средната стойност на атрибута в популацията се намира в интервала, с вероятност от 95,5% - в интервала и т.н.

    На практика се изгражда интервал около стойността на извадката, така че с дадена (достатъчно висока) вероятност, вероятност за доверие –ще „покрие“ истинската стойност на този параметър в общата популация. Този интервал се нарича доверителен интервал.

    Вероятност за довериеП това е степента на увереност, че доверителният интервал действително ще съдържа истинската (неизвестна) стойност на параметъра в популацията.

    Например, ако вероятността за доверие Ре 90%, това означава, че 90 проби от 100 ще дадат правилната оценка на параметъра в популацията. Съответно вероятността от грешка, т.е. неправилна оценка на общата средна стойност за извадката е равна в проценти: . За този пример това означава, че 10 проби от 100 ще дадат неправилна оценка.

    Очевидно степента на доверие (вероятността на доверие) зависи от размера на интервала: колкото по-широк е интервалът, толкова по-висока е увереността, че неизвестна стойност за популацията ще попадне в него. На практика най-малко два пъти грешката на извадката се използва за конструиране на доверителен интервал, за да се осигури поне 95,5% увереност.

    Определянето на доверителните граници на средните и относителните стойности ни позволява да намерим двете им крайни стойности - минималната възможна и максималната възможна, в рамките на които изследваният показател може да се появи в цялата популация. Въз основа на това, доверителни граници (или доверителен интервал)- това са границите на средни или относителни стойности, извън които поради случайни колебания има незначителна вероятност.

    Доверителният интервал може да бъде пренаписан като: , където T– критерий за доверие.

    Доверителните граници на средноаритметичната стойност в популацията се определят по формулата:

    М ген = М изберете + t m М

    за относителна стойност:

    Р ген = П изберете + t m Р

    Където М генИ Р ген- стойности на средни и относителни стойности за генералната съвкупност; М изберетеИ Р изберете- стойности на средни и относителни стойности, получени от извадката; м МИ м П- грешки на средни и относителни стойности; T- критерий за доверие (критерий за точност, който се установява при планиране на изследването и може да бъде равен на 2 или 3); t m- това е доверителен интервал или Δ - максималната грешка на показателя, получена при извадково изследване.

    Трябва да се отбележи, че стойността на критерия Tдо известна степен свързана с вероятността за безгрешна прогноза (p), изразена в %. Избира се от самия изследовател, ръководен от необходимостта да получи резултата с необходимата степен на точност. По този начин, за вероятността за безгрешна прогноза от 95,5%, стойността на критерия Tе 2, за 99,7% - 3.

    Дадените оценки на доверителния интервал са приемливи само за статистически популации с наблюдения над 30. При по-малък размер на популацията (малки извадки) се използват специални таблици за определяне на критерия t. В тези таблици желаната стойност се намира в пресечната точка на линията, съответстваща на размера на популацията (n-1)и колона, съответстваща на нивото на вероятност за прогноза без грешки (95,5%; 99,7%), избрана от изследователя. В медицинските изследвания, когато се установяват граници на доверие за всеки индикатор, вероятността за безгрешна прогноза е 95,5% или повече. Това означава, че стойността на показателя, получена от извадковата съвкупност, трябва да бъде намерена в генералната съвкупност в поне 95,5% от случаите.

      Въпроси по темата на урока:

      Уместност на показателите за разнообразие на признаци в статистическа популация.

      Основни характеристики абсолютни показателивариации.

      Стандартно отклонение, изчисление, приложение.

      Относителни мерки на вариация.

      Медиана, квартилен резултат.

      Оценка на статистическата значимост на резултатите от изследването.

      Стандартна грешка на средноаритметичната стойност, формула за изчисление, пример за използване.

      Изчисляване на пропорцията и нейната стандартна грешка.

      Концепцията за доверителна вероятност, пример за използване.

    10. Концепцията за доверителен интервал, неговото приложение.

      Тестови задачи по темата със стандартни отговори:

    1. АБСОЛЮТНИТЕ ПОКАЗАТЕЛИ НА ВАРИАЦИЯТА СЕ ОТНАСЯТ КЪМ

    1) коефициент на вариация

    2) коефициент на трептене

    4) медиана

    2. ОТНОСИТЕЛНИТЕ ПОКАЗАТЕЛИ НА ВАРИАЦИЯТА СЕ СВЪРЗВАТ

    1) дисперсия

    4) коефициент на вариация

    3. КРИТЕРИИ, КОИТО СЕ ОПРЕДЕЛЯТ ОТ ЕКСТРЕМАЛНИТЕ СТОЙНОСТИ НА ОПЦИЯ В СЕРИЯ ИЗМЕНЕНИЯ

    2) амплитуда

    3) дисперсия

    4) коефициент на вариация

    4. РАЗЛИКАТА НА ЕКСТРЕМНИТЕ ВАРИАНТИ Е

    2) амплитуда

    3) стандартно отклонение

    4) коефициент на вариация

    5. СРЕДНИЯТ КВАДРАТ НА ОТКЛОНЕНИЯТА НА ИНДИВИДУАЛНИТЕ СТОЙНОСТИ НА ХАРАКТЕРИСТИКА ОТ НЕЙНИТЕ СРЕДНИ СТОЙНОСТИ Е

    1) коефициент на трептене

    2) медиана

    3) дисперсия

    6. СЪОТНОШЕНИЕТО НА СКАЛАТА НА ВАРИАЦИЯТА КЪМ СРЕДНАТА СТОЙНОСТ НА ХАРАКТЕРА Е

    1) коефициент на вариация

    2) стандартно отклонение

    4) коефициент на трептене

    7. СЪОТНОШЕНИЕТО НА СРЕДНОТО КВАДРАТНО ОТКЛОНЕНИЕ КЪМ СРЕДНАТА СТОЙНОСТ НА ХАРАКТЕРИСТИКАТА Е

    1) дисперсия

    2) коефициент на вариация

    3) коефициент на трептене

    4) амплитуда

    8. ОПЦИЯТА, КОЯТО Е В СРЕДАТА НА ВАРИАЦИОННАТА СЕРИЯ И Я РАЗДЕЛЯ НА ДВЕ РАВНИ ЧАСТИ Е

    1) медиана

    3) амплитуда

    9. В МЕДИЦИНСКИТЕ ИЗСЛЕДВАНИЯ, ПРИ УСТАНОВЯВАНЕ НА ДОВЕРИТЕЛНИ ГРАНИЦИ НА ВСЯК ИНДИКАТОР, СЕ ПРИЕМА ВЕРОЯТНОСТТА ЗА БЕЗГРЕШНА ПРОГНОЗА

    10. АКО 90 ПРОБИ ОТ 100 ДАВАТ ПРАВИЛНАТА ОЦЕНКА НА ПАРАМЕТЪР В ПОПУЛАЦИЯТА, ТОВА ОЗНАЧАВА, ЧЕ ВЕРОЯТНОСТТА ЗА ДОВЕРИЕ ПРАВЕН

    11. АКО 10 ПРОБИ ОТ 100 ДАВАТ НЕПРАВИЛНА ОЦЕНКА, ВЕРОЯТНОСТТА ЗА ГРЕШКА Е

    12. ГРАНИЦИ НА СРЕДНИ ИЛИ ОТНОСИТЕЛНИ СТОЙНОСТИ, ПРЕДВИЖДАНЕТО НА КОИТО ПОРАДИ СЛУЧАЙНИ КОЛЕБАНИЯ ИМА МАЛКА ВЕРОЯТНОСТ – ТОВА Е

    1) доверителен интервал

    2) амплитуда

    4) коефициент на вариация

    13. ЗА МАЛКА ИЗВАДКА СЕ СЧИТА ТАЗИ ПОПУЛАЦИЯ, В КОЯТО

    1) n е по-малко или равно на 100

    2) n е по-малко или равно на 30

    3) n е по-малко или равно на 40

    4) n е близо до 0

    14. ЗА ВЕРОЯТНОСТ ЗА БЕЗГРЕШНА ПРОГНОЗА 95% КРИТЕРИЙНА СТОЙНОСТ TЕ

    15. ЗА ВЕРОЯТНОСТ ЗА БЕЗГРЕШНА ПРОГНОЗА 99% КРИТЕРИЙНА СТОЙНОСТ TЕ

    16. ЗА РАЗПРЕДЕЛЕНИЯ, БЛИЗКИ ДО НОРМАЛНОТО, ПОПУЛАЦИЯТА СЕ СЧИТА ЗА ХОМОГЕННА, АКО КОЕФИЦИЕНТЪТ НА ВАРИАЦИЯ НЕ ПРЕВИШАВА

    17. ОПЦИЯ, РАЗДЕЛИТЕЛНИ ОПЦИИ, ЧИИСТО ЧИСЛОВИТЕ СТОЙНОСТИ НЕ ПРЕВИШАВАТ 25% ОТ МАКСИМАЛНО ВЪЗМОЖНИТЕ В ДАДЕНА СЕРИЯ – ТОВА Е

    2) долен квартил

    3) горен квартил

    4) квартил

    18. ДАННИ, КОИТО НЕ ИЗКРИВЯВАТ И ПРАВИЛНО ОТРАЗЯВАТ ОБЕКТИВНАТА РЕАЛНОСТ, СЕ НАРИЧАТ

    1) невъзможно

    2) еднакво възможно

    3) надежден

    4) случаен

    19. СЪГЛАСНО ПРАВИЛОТО НА "ТРИ Сигми", С НОРМАЛНО РАЗПРЕДЕЛЕНИЕ НА ХАРАКТЕРИСТИКА В ВРЪХ
    ЩЕ БЪДАТ ЛОКАЛИЗАЦИИ

    1) 68,3% опция

    дисперсия. Стандартно отклонение

    дисперсияе средната аритметична стойност на квадратните отклонения на всяка стойност на атрибут от общата средна стойност. В зависимост от изходните данни дисперсията може да бъде непретеглена (проста) или претеглена.

    Дисперсията се изчислява по следните формули:

    · за негрупирани данни

    · за групирани данни

    Процедурата за изчисляване на претеглената дисперсия:

    1. определяне на средното аритметично претеглено

    2. определят се отклонения на варианта от средното

    3. повдигнете на квадрат отклонението на всяка опция от средната стойност

    4. умножете квадратите на отклоненията по тегла (честоти)

    5. обобщете получените продукти

    6. получената сума се разделя на сумата от везните

    Формулата за определяне на дисперсията може да се преобразува в следната формула:

    - просто

    Процедурата за изчисляване на дисперсията е проста:

    1. определям средноаритметичното

    2. повдигнете на квадрат средното аритметично

    3. квадрат всяка опция в реда

    4. опция за намиране на сумата от квадрати

    5. разделете сумата на квадратите на техния брой, т.е. определяне на средния квадрат

    6. определяне на разликата между средния квадрат на характеристиката и квадрата на средната стойност

    Освен това формулата за определяне на претеглената дисперсия може да се преобразува в следната формула:

    тези. дисперсията е равна на разликата между средната стойност на квадратните стойности на атрибута и квадрата на средната аритметична стойност. При използване на трансформираната формула се елиминира допълнителната процедура за изчисляване на отклоненията на индивидуалните стойности на характеристика от x и се елиминира грешката в изчислението, свързана със закръгляването на отклоненията

    Дисперсията има редица свойства, някои от които улесняват изчисляването:

    1) дисперсията на постоянна стойност е нула;

    2) ако всички варианти на стойностите на атрибута са намалени с едно и също число, тогава дисперсията няма да намалее;

    3) ако всички варианти на стойностите на атрибута са намалени с еднакъв брой пъти (кратно), тогава дисперсията ще намалее с фактор

    Стандартно отклонение S- представлява корен квадратен от дисперсията:

    · за негрупирани данни:

    ;

    · за вариационната серия:

    Диапазонът на вариация, линейната средна стойност и стандартното отклонение са именувани величини. Те имат същите мерни единици като индивидуални ценностизнак.

    Дисперсията и стандартното отклонение са най-широко използваните мерки за вариация. Това се обяснява с факта, че те са включени в повечето теореми на теорията на вероятностите, която служи като основа математическа статистика. Освен това дисперсията може да се разложи на съставни елементи, което позволява да се оцени влиянието на различни фактори, причиняващи вариация в черта.

    Изчисляването на вариационните показатели за банките, групирани по норма на печалба, е показано в таблицата.

    Размер на печалбата, милиони рубли. Брой банки изчислени показатели
    3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
    4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
    5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
    6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
    7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
    Обща сума: 121,70 17,640 23,126

    Средното линейно и стандартно отклонение показват доколко стойността на дадена характеристика се колебае средно между единиците и изследваната популация. И така, в този случай средното колебание в печалбата е: според средното линейно отклонение, 0,882 милиона рубли; със стандартно отклонение - 1,075 милиона рубли. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Ако разпределението на характеристиката е близко до нормалното, тогава има връзка между S и d: S=1.25d, или d=0.8S. Стандартното отклонение показва как по-голямата част от единиците на съвкупността са разположени спрямо средната аритметична стойност. Независимо от формата на разпределението, 75 стойности на атрибута попадат в интервала x 2S и най-малко 89 от всички стойности попадат в интервала x 3S (теорема на P.L. Chebyshev).