доверительный интервал 95 процентов что значит
Доверительный интервал. Азбука медицинской статистики. Глава III
Константин Кравчик доходчиво объясняет, что такое доверительный интервал в медицинских исследованиях и как его использовать
«Катрен-Стиль» продолжает публикацию цикла Константина Кравчика о медицинской статистике. В двух предыдущих статьях автор касался объяснения таких понятий, как размер выборки, генеральная совокупность, статистическая гипотеза и классификацию шкал.
Математик-аналитик. Специалист в области статистических исследований в медицине и гуманитарных науках
Очень часто в статьях по клиническим исследованиям можно встретить загадочное словосочетание: «доверительный интервал» (95 % ДИ или 95 % CI — confidence interval). Например, в статье может быть написано: «Для оценки значимости различий использовали t-критерий Стьюдента с расчетом 95 % доверительного интервала».
Какого же значение «95 % доверительного интервала» и зачем его рассчитывать?
Что такое доверительный интервал? — Это диапазон, в котором находятся истинные средние значения в генеральной совокупности. А что, бывают «неистинные» средние значения? В каком‑то смысле да, бывают. В прошлой статье мы объясняли, что невозможно измерить интересующий параметр во всей генеральной совокупности, поэтому исследователи довольствуются ограниченной выборкой. В этой выборке (например, по массе тела) есть одно среднее значение (определенный вес), по которому мы и судим о среднем значении во всей генеральной совокупности. Однако едва ли средний вес в выборке (особенно небольшой) совпадет со средним весом в генеральной совокупности. Поэтому более правильно рассчитывать и пользоваться диапазоном средних значений генеральной совокупности.
Например, представим, что 95 % доверительный интервал (95 % ДИ) по гемоглобину составляет от 110 до 122 г/л. Это означает, что с вероятностью 95 % истинное среднее значение по гемоглобину в генеральной совокупности будет находиться в пределах от 110 до 122 г/л. Иными словами, мы не знаем средний показатель гемоглобина в генеральной совокупности, но можем с 95 %-й вероятностью указать диапазон значений для этого признака.
Доверительный интервал особенно уместен для разницы в средних значениях между группами или, как это называют, в размере эффекта.
Допустим, мы сравнивали эффективность двух препаратов железа: давно присутствующего на рынке и только что зарегистрированного. После курса терапии оценили концентрацию гемоглобина в исследуемых группах пациентов, и статистическая программа нам посчитала, что разность между средними значениями двух групп с вероятностью 95 % находится в диапазоне от 1,72 до 14,36 г/л (табл. 1).
Табл. 1. Критерий для независимых выборок
(сравниваются группы по уровню гемоглобина)
t-критерий | Значимость (2-сторонняя) | Разность средних | 95 % доверительный интервал для разности | |
2,609 | 0,014 | 8,048 | 1,7274 | 14,3678 |
Трактовать это следует так: у части пациентов генеральной совокупности, которая принимает новый препарат, гемоглобин будет выше в среднем на 1,72–14,36 г/л, чем у тех, кто принимал уже известный препарат.
Иными словами, в генеральной совокупности разность в средних значениях по гемоглобину у групп с 95 %-й вероятностью находится в этих пределах. Судить, много это или мало, будет уже исследователь. Смысл всего этого в том, что мы работаем не с одним средним значением, а с диапазоном значений, следовательно, мы более достоверно оцениваем разницу по параметру между группами.
В статистических пакетах, на усмотрение исследователя, можно самостоятельно сужать или расширять границы доверительного интервала. Снижая вероятности доверительного интервала, мы сужаем диапазон средних. Например, при 90 % ДИ диапазон средних (или разницы средних) будет уже, чем при 95 %.
И наоборот, увеличение вероятности до 99 % расширяет диапазон значений. При сравнении групп нижняя граница ДИ может пересечь нулевую отметку. Например, если мы расширили границы доверительного интервала до 99 %, то границы интервала расположились от –1 до 16 г/л. Это означает, что в генеральной совокупности есть группы, различие средних между которыми по изучаемому признаку равняется 0 (М=0).
Почему рекомендуется смотреть на доверительный интервал? Для большей наглядности обратимся к рисунку.
95% доверительный интервал разницы по гемоглобину, (г/л)
На рисунке в виде линии изображен 95 % доверительный интервал разницы средних значений по гемоглобину между двумя группами. Линия проходит нулевую отметку, следовательно, имеет место разница между средними значениями, равная нулю, что подтверждает нулевую гипотезу о том, что группы не различаются. Диапазон разницы между группами лежит от –2 до 5 г/л, Это означает, что гемоглобин может как снизиться на 2 г/л, так и повыситься на 5 г/л.
Доверительный интервал — очень важный показатель. Благодаря ему можно посмотреть, были ли различия в группах действительно за счет разности средних или за счет большой выборки, т. к. при большой выборке шансы найти различия больше, чем при малой.
На практике это может выглядеть так. Мы взяли выборку в 1000 человек, измерили уровень гемоглобина и обнаружили, что доверительный интервал разницы средних лежит от 1,2 до 1,5 г/л. Уровень статистической значимости при этом p 21997 просмотров
Нашли ошибку? Выделите текст и нажмите Ctrl+Enter.
Русские Блоги
Быстро понять понимание 95% доверительного интервала в одной статье
Быстро понять понимание 95% доверительного интервала в одной статье
Всесторонне знать ответы главных богов и сетевые данные, чтобы понять 95% доверительный интервал этой статьи.
Сделайте вывод первым
Наиболее часто встречающаяся пара доверительных интервалов ошибка понимание:
верныйОбъяснение должно быть таким:
Доверительный интервал 95% означает, что если вы выполните те же действия для выбора образцов и расчета доверительного интервала,Тогда при 100-кратном таком независимом процессе существует 95% вероятность того, что рассчитанный вами интервал будет содержать истинное значение параметра, то есть будет около 95 доверительных интервалов, которые будут содержать истинное значение.
И для определенного расчетаМы не можем обсуждать вероятность того, что определенный доверительный интервал содержит истинное значение.
Другими словами, мы можем сказать,Если мы повторим выборку и воспользуемся этим методом для построения доверительного интервала после каждой выборки, 95% доверительного интервала будет содержать истинное значение.. Однако (в частотной школе) мыНевозможно обсуждать вероятность того, что один из доверительных интервалов содержит истинное значение.
Детальный анализ
Ссылка на снимок экрана: Zhihu-Как понять 95% доверительный интервал?
Предполагается, что он будет разделен на «Точечная оценка«с участием»Оценка интервала”
Интервальная оценка также называетсяОценка доверительного интервала, Для получения доверительного интервала требуется выборочная статистика (например, среднее значение) и вычисление дисперсии по данным. Центральная предельная теорема говорит нам, что среднее значение будет близко к распределению Гаусса. Мы можем использовать стандартное отклонение для вычисления вероятности что истинное ожидание попадает в выбранный интервал. Например, область с вероятностью 0,95 с центром на среднем значении μ ^ равна (на основе распределения Гаусса):
Отступление: в экспериментах с машинным обучением мы обычно используем среднюю ошибку выборок тестового набора для оценки ошибки обобщения. Обычно мы говорим, что алгоритм A лучше, чем алгоритм B, что означает, что верхняя граница 95% доверительного интервала ошибка алгоритма A меньше, чем у алгоритма. Нижняя граница 95% доверительного интервала для ошибки A.
В заключении
Предполагая, что теперь он находится на уровне достоверности 95% (95% также называют уровнем достоверности, что является привычкой в статистике и может корректироваться в зависимости от приложения.),95% доверительный интервал может быть получен для каждой выборки, взятой из совокупности, и доверительный интервал, полученный для разных выборок, отличается, но по мере увеличения количества взятых выборок, например, отбирается 100 выборок и получается 100 выборок, Каждая выборка соответствует доверительному интервалу, поэтому 95 из 100 доверительных интервалов, полученных из 100 выборок, содержат истинное среднее значение генеральной совокупности.
Доверительный интервал будет варьироваться от образца к образцу (Как рассчитывается доверительный интервал? Черезобразец(Образец) рассчитано), и не все интервалы содержат значения истинности, Интервал подобен забросу сети для захвата общих неизвестных параметров. Не все места, где используется сеть, могут захватывать общие параметры, которые мы хотим.
Доверительный интервал за 15 минут
Добрый день, уважаемые читатели!
Меня зовут Кирилл Мильчаков. Сегодня мы продолжаем наш разговор о биостатистике. Тема сегодняшней нашей беседы будет «Доверительный интервал». Что такое доверительный интервал? Вы наверняка встречались с ним в научной литературе. Доверительный интервал 95 %, либо сочетание символов ДИ и CI (confidence interval) 95 %. Что же означают эти 95 %? Какие он еще может принимать значения? И как его рассчитывать самостоятельно? Об этом обо всем сегодня мы и поговорим в этой статье.
Видео-версия статьи о доверительном интервале
Генеральная совокупность и выборочная совокупность
Прежде чем углубляться в тайны доверительного интервала, хотел бы вспомнить с вами 2 основных понятия статистической совокупности, с которыми чаще всего работают – это генеральная совокупность или выборочная совокупность или выборка.
Генеральная совокупность – это тот массив данных, о которых вы хотите сделать выводы.
Выборка является частью генеральной совокупности, которая участвует непосредственно в вашем эксперименте. Есть такое понятие как репрезентативность, сегодня мы не будем его касаться, главное запомнить, что выборка должна быть репрезентативной.
Если привести небольшой пример относительно генеральной совокупности и выборки, то можно вспомнить о простом случае из вашей жизни. Когда вы хотите узнать, достаточно ли посолен суп, вы берете ложку супа и пробуете его. Вам необязательно есть весь суп, чтобы понять, насколько он посолен. Ложка в данном случае является выборкой, по которой вы делаете вывод обо всей кастрюле супа. В данном случае кастрюля супа является генеральной совокупностью, а ложка супа является выборкой.
Итак, мы вспомнили с вами о 2 ключевых статистических совокупностях – о генеральной совокупности и выборочной совокупности. Теперь нужно вспомнить, что типы исследования, которые проводятся над генеральной совокупностью и выборочной совокупностью, называют по-разному. Над генеральной совокупностью проводятся так называемые сплошные исследования, над выборочной совокупностью – выборочные.
Теперь вспомним небольшие отличия между параметрами этих 2 совокупностей. Сегодня для того, чтобы понять, что такое доверительный интервал, нам понадобятся следующие вещи: во-первых, отличие средней арифметической в генеральной совокупности и в выборочной совокупности. В генеральной совокупности она имеет значок µ (мю), в выборочной – это x̅ (х с чертой) — это средние арифметические по каждому виду совокупности.
Далее нужно знать, что стандартное отклонение имеет значок выборочной – либо S, либо SD (standard deviation), а в случае генеральной совокупности оно носит название среднеквадратичного отклонения и обозначается буквой σ (сигма).
Приведем пример расчета доврительного интервала
Представьте чисто гипотетическую ситуацию, когда перед нами стоит задача исследований среднего роста марсианина. Для того, чтобы его узнать, было отправлено 3 экспедиции. Первой из них повезло больше всего: они смогли поймать каждого из 200 марсианин и померить его рост.
Как мы помним, по закону нормального распределения по оси Х находится величина изучаемого признака, либо варианта (в данном случае это рост в сантиметрах), а по оси Y – частота встречаемости какого-то признака (мы его обозначаем буквой П.
Итак, оказалось, что у всех 200 марсиан средний рост составил 40 сантиметров. Таким образом, первая экспедиция смогла провести так называемое сплошное исследование, так как поработала со всеми единицами наблюдения генеральной совокупности. Поэтому мы имеем право назвать этот параметр µ.
Однако, второй и третьей экспедиции повезло гораздо меньше. Они попали в самые плохо населенные участки Марса и смогли отобрать только 10 марсиан. В данном случае оказалось, что средний рост по их выборке составил всего 38 сантиметров в первом случае и 41 сантиметр во втором случае.
Что же делать? Да, у нас есть данные из самого полного исследования, которое относится к первой экспедиции. Но представьте, что ни одна бы из них не смогла бы поработать со всей совокупностью полностью, и у нас были бы данные только от второй и третьей экспедиции. Что же в этой ситуации делать? Видно, что никто 40 сантиметров в действительности не достиг: во второй экспедиции Б она равна 38 сантиметрам, а в экспедиции В – 41 сантиметр. То есть в реальности никто не достиг 40 сантиметров. Что же делать в данном случае?
И вот здесь на помощь к нам приходит доверительный интервал, точнее оценка параметра. Доверительный интервал является вторым этапом оценки параметра. Прежде чем строить доверительный интервал, нам нужно понять, насколько в принципе этот параметр наша средняя (x̅б, x̅в) может отличаться, ошибаться от реального параметра в генеральной совокупности. Насколько?
Итак, предположим, мы нашли нашу ошибку репрезентативности mr. В данном случае она составила 2,7 сантиметра. Но что же это нам дает? А дает нам это уже достаточно много. Теперь мы, зная, насколько в принципе наша выборка может ошибаться относительно генеральной совокупности, можем составить определенное предположение о том, где же находится реальный параметр – реальные 40 сантиметров генеральной совокупности на основании данных лишь нашей выборки.
Для того, чтобы не залезать в критерий Стьюдента сегодня, я скажу лишь, что:
для доверительного интервала 95 % используется t=2,
для доверительного интервала 99 % используется t=3
и для доверительного интервала 68 % используется t=1.
Итак, после того, как мы нашли нашу предельную ошибку, мы можем построить доверительный интервал. Но для этого нам нужно самим задать тот доверительный интервал, который для нас подходит больше всего. Чаще всего в медицине используется вероятность ошибки 5 %, то есть доверительный интервал 95 % или вероятность ошибки 5 % (р=0,05, р=5 %).
Что же значат эти 95 %? А значат они следующее, что с 95%-ной вероятностью в нашем интервале лежит реальное значение, и лишь в 5 % случаев мы ошибаемся. То есть в нашем конкретном случае наша ошибка репрезентативности составила 2,7 сантиметра. Предельная ошибка отсюда будет равна чему? Именно 5,4 сантиметра, то есть доверительный интервал, так как здесь и плюс, и минус, то есть нам нужно ошибку умножить на 2, составил 10,8 сантиметров. А именно наши 38 см±5,4 см. Ширина всего доверительного интервала составляет 10,8 см. Напомню, что он складывается из положительной и отрицательной предельных ошибок вокруг нашей выборочной средней.
Итак, говоря о доверительном интервале, нужно сделать ряд важных выводов.
Если это видео оказалось Вам полезным, оно хотя бы немного раскрыло тайны доверительного интервала, ставьте лайки, подписывайтесь на наши рассылки и в комментариях пишите, какие темы по биостатистике вам бы были интересны для следующих выпусков. На этом я с вами прощаюсь. Меня зовут Кирилл. Пока!
Что означает 95% доверительный интервал в 95% доверительном интервале?
Строго говоря, доверительный интервал 95% означает, что если бы мы 100 различных образцов и вычислить 95% доверительный интервал для каждого образца, тогда примерно 95 из 100 доверительных интервалов будут содержать истинное среднее значение (μ).
Кроме того, как рассчитать 95% доверительный интервал?
Что такое хороший 95% доверительный интервал?
95% доверительный интервал был рассчитан как [0.410, 0.559]. Правильная интерпретация этого доверительного интервала заключается в том, что мы на 95% уверены в том, что корреляция между ростом и весом среди всех студентов World Campus составляет от 0.410 до 0.559.
Также необходимо знать. Какое критическое значение для 95% доверительного интервала? Критическое значение для 95% доверительного интервала: 1.96, где (1-0.95) / 2 = 0.025.
Что такое значение p в доверительном интервале?
Значение p равно вероятность, который является результатом такого статистического теста. Эта вероятность отражает меру доказательств против нулевой гипотезы. Маленькие p-значения соответствуют убедительным доказательствам. Если значение p ниже заранее определенного предела, результаты обозначаются как «статистически значимые» (1).
Что такое хороший доверительный интервал?
Размер и изменчивость выборки
Уровень достоверности также влияет на ширину интервала. Если вы хотите более высокого уровня уверенности, этот интервал не будет таким уж коротким. Плотный интервал с достоверностью 95% или выше идеально.
Какова связь между 90% доверительным интервалом вокруг среднего и 95% доверительным интервалом вокруг среднего?
Какова связь между 90% доверительным интервалом вокруг среднего и 95% доверительным интервалом вокруг среднего? 90% доверительный интервал шире и включает больше значений, чем 95% доверительный интервал. 95% доверительный интервал более точен при оценке среднего значения, чем 90% доверительный интервал.
Как вы делаете доверительные интервалы?
Как построить доверительный интервал
Где бы вы использовали доверительный интервал в повседневной жизни?
Доверительные интервалы часто используются в клинических испытаниях для определения среднего изменения артериального давления, частоты сердечных сокращений, холестерина и т. д., вызванного каким-либо новым лекарством или лечением. Например, врач может полагать, что новое лекарство способно снизить артериальное давление у пациентов.
Почему мы используем 95 доверительный интервал вместо 99?
Например, доверительный интервал 99% будет шире, чем доверительный интервал 95%, потому что чтобы быть более уверенными в том, что истинное значение совокупности попадает в интервал, нам необходимо разрешить больше потенциальных значений в пределах интервала. Чаще всего принимается уровень достоверности 95%.
Как выбрать доверительный интервал?
Если вы хотите быть уверены в своих результатах более чем на 95%, вам необходимо
складывать и вычитать более двух стандартных ошибок
. Например, чтобы быть уверенным на 99%, вы должны добавить и вычесть около двух с половиной стандартных ошибок, чтобы получить предел погрешности (2.58, если быть точным).
Выбор уровня достоверности для выборки населения.
Какое критическое значение 99%?
Таким образом, Z
α
/
2
= 1.645 для уверенности 90%. 2) Используйте таблицу t-распределения (Таблица A-3, стр. 726). Пример: найти Z
α
/
2
для 98% уверенности.
Доверие (1 – α) г 100% | Значение α | Критическое значение Z α / 2 |
---|---|---|
90% | 0.10 | 1.645 |
95% | 0.05 | 1.960 |
98% | 0.02 | 2.326 |
99% | 0.01 | 2.576 |
Каков показатель T для доверительного интервала 90?
Например, если вы хотите получить значение t для доверительного интервала 90% при наличии 9 степеней свободы, перейдите к нижней части таблицы, найдите столбец для 90% и пересеките его со строкой для df = 9. Это дает вам по цене 1.833 (округлено).
Какое критическое значение T для доверительного интервала 99?
Критические ценности студента
Конф. Уровень | 50% | 99% |
---|---|---|
Один хвост | 0.250 | 0.005 |
80 | 0.678 | 2.639 |
90 | 0.677 | 2.632 |
100 | 0.677 | 2.626 |
Что такое формула p-значения?
Является ли P 0.001 статистически значимым?
Большинство авторов относят к статистически значимым значениям P Что такое хорошее p-значение?
P-значение меньше, чем 0.05 (обычно ≤ 0.05) является статистически значимым. … Значение p выше 0.05 (> 0.05) не является статистически значимым и указывает на убедительные доказательства нулевой гипотезы.
Что лучше 95% или 99% доверительный интервал?
Чем хорош 95% доверительный интервал?
Каковы коэффициенты достоверности 95%?
Почему важен доверительный интервал?
Так как доверительные интервалы представляют собой диапазон баллов, которые, вероятно, если бы мы повторили опрос, они важную учитывать при обобщении результатов.
Какой пример доверительных интервалов?
Простыми словами, что такое доверительный интервал?
Непрофессионала. термины. Доверительные интервалы. Для данной статистики, рассчитанной для выборки наблюдений (например, среднего), доверительный интервал равен диапазон значений вокруг этой статистики, которые, как предполагается, содержат, с определенной вероятностью (например, 95%), истинное значение этой статистики (т.е. значение совокупности).
В чем важность использования доверительного интервала?
Поскольку доверительные интервалы представляют собой диапазон оценок, которые вероятны, если мы повторим опрос, они важны. учитывать при обобщении результатов.
Доверительные интервалы
Общий обзор
Взяв выборку из популяции, мы получим точечную оценку интересующего нас параметра и вычислим стандартную ошибку для того, чтобы указать точность оценки.
Однако, для большинства случаев стандартная ошибка как такова не приемлема. Гораздо полезнее объединить эту меру точности с интервальной оценкой для параметра популяции.
Это можно сделать, используя знания о теоретическом распределении вероятности выборочной статистики (параметра) для того, чтобы вычислить доверительный интервал (CI – Confidence Interval, ДИ – Доверительный интервал) для параметра.
Вообще, доверительный интервал расширяет оценки в обе стороны некоторой величиной, кратной стандартной ошибке (данного параметра); два значения (доверительные границы), определяющие интервал, обычно отделяют запятой и заключают в скобки.
Доверительный интервал для среднего
Использование нормального распределения
Выборочное среднее имеет нормальное распределение, если объем выборки большой, поэтому можно применить знания о нормальном распределении при рассмотрении выборочного среднего.
В частности, 95% распределения выборочных средних находится в пределах 1,96 стандартных отклонений (SD) среднего популяции.
Когда у нас есть только одна выборка, мы называем это стандартной ошибкой среднего (SEM) и вычисляем 95% доверительного интервала для среднего следующим образом:
Если повторить этот эксперимент несколько раз, то интервал будет содержать истинное среднее популяции в 95% случаев.
Обычно это доверительный интервал как, например, интервал значений, в пределах которого с доверительной вероятностью 95% находится истинное среднее популяции (генеральное среднее).
Хотя это не вполне строго (среднее в популяции есть фиксированное значение и поэтому не может иметь вероятность, отнесённую к нему) таким образом интерпретировать доверительный интервал, но концептуально это удобнее для понимания.
Использование t-распределения
Можно использовать нормальное распределение, если знать значение дисперсии в популяции. Кроме того, когда объем выборки небольшой, выборочное среднее отвечает нормальному распределению, если данные, лежащие в основе популяции, распределены нормально.
Если данные, лежащие в основе популяции, распределены ненормально и/или неизвестна генеральная дисперсия (дисперсия в популяции), выборочное среднее подчиняется t-распределению Стьюдента.
Вычисляем 95% доверительный интервал для генерального среднего в популяции следующим образом:
где — процентная точка (процентиль) t-распределения Стьюдента с (n-1) степенями свободы, которая даёт двухстороннюю вероятность 0,05.
Вообще, она обеспечивает более широкий интервал, чем при использовании нормального распределения, поскольку учитывает дополнительную неопределенность, которую вводят, оценивая стандартное отклонение популяции и/или из-за небольшого объёма выборки.
Когда объём выборки большой (порядка 100 и более), разница между двумя распределениями (t-Стьюдента и нормальным) незначительна. Тем не менее всегда используют t-распределение при вычислении доверительных интервалов, даже если объем выборки большой.
Обычно указывают 95% ДИ. Можно вычислить другие доверительные интервалы, например 99% ДИ для среднего.
Вместо произведения стандартной ошибки и табличного значения t-распределения, которое соответствует двусторонней вероятности 0,05, умножают её (стандартную ошибку) на значение, которое соответствует двусторонней вероятности 0,01. Это более широкий доверительный интервал, чем в случае 95%, поскольку он отражает увеличенное доверие к тому, что интервал действительно включает среднее популяции.
Доверительный интервал для пропорции
Выборочное распределение пропорций имеет биномиальное распределение. Однако если объём выборки n разумно большой, тогда выборочное распределение пропорции приблизительно нормально со средним .
Оцениваем выборочным отношением p=r/n (где r– количество индивидуумов в выборке с интересующими нас характерными особенностями), и стандартная ошибка оценивается:
95% доверительный интервал для пропорции оценивается:
Если объём выборки небольшой (обычно когда np или n(1-p) меньше 5), тогда необходимо использовать биномиальное распределение для того, чтобы вычислить точные доверительные интервалы.
Заметьте, что если p выражается в процентах, то (1-p) заменяют на (100-p).
Интерпретация доверительных интервалов
При интерпретации доверительного интервала нас интересуют следующие вопросы:
Насколько широк доверительный интервал?
Широкий доверительный интервал указывает на то, что оценка неточна; узкий указывает на точную оценку.
Ширина доверительного интервала зависит от размера стандартной ошибки, которая, в свою очередь, зависит от объёма выборки и при рассмотрении числовой переменной от изменчивости данных дают более широкие доверительные интервалы, чем исследования многочисленного набора данных немногих переменных.
Включает ли ДИ какие-либо значения, представляющие особенный интерес?
Можно проверить, ложится ли вероятное значение для параметра популяции в пределы доверительного интервала. Если да, то результаты согласуются с этим вероятным значением. Если нет, тогда маловероятно (для 95% доверительного интервала шанс почти 5%), что параметр имеет это значение.