Главное Свежее Вакансии Образование
953 67 В избр. Сохранено
Авторизуйтесь
Вход с паролем

А умеют ли стартаперы анализировать и считать?

Предлагаю всем решить простую задачку.

Мне эта задачка очень нравится, так как тематически связана с моим проектом.

А вы можете проверить свои аналитические способности и умение считать.

Условия:

Пациент пришел к врачу с жалобами на здоровье. Врач заподозрил наличие некоего заболевания, распространенность которого 1 больной на 1000 человек. Врач предложил пройти тест, достоверность которого 95%. Пациент прошел тест и результат был положительный (болен).

Вопрос:

Какова вероятность того, что пациент болен?

+1
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
WiseMike
Телеграм-бот для мониторинга вебсайтов
Мартин Иден
задача интересная. если бегло, то тест нивелирует диагноз врача по вероятности (т.е. после теста диагноз уже не имеет никакого значения). следовательно, если тест имеет вероятность "попадания" 95 %, и учитывая что тест попадает в "болен или не болен", - то человек болен с вероятностью 0,5*0,95=0,475 или 47,5 %. примерно так.
UPD: хотя, смущает последнее предложение в задаче - болен)
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Вы своим 0,5 огорчаете Министерство здравоохранения Российской Федерации.
Ответить
Дмитрий Веселов
Расчет совершенно неверный.
По вашей формуле, если у теста была бы достоверность 100% (т.е. тест всегда показывает только верный результат), вероятность того, что пациент болен, была бы 50%. Вам не кажется это нелогичным?
Никаких хитростей в формулировках задачи нет, она чисто математическая. Для ее решения необходимо использовать все исходные данные, а вы пренебрегли данными по распространенности заболевания.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Вероятность заболевания не нужна. Если вы наблюдаете падающий метеорит, то вам уже должно всё равно на вероятность его появления - он точно рухнет на голову.
Ответить
Дмитрий Веселов
В данной ситуации болезнь не наблюдается. Симптомами можно пренебречь, у них может быть совершенно иная причина несвязанная с заболеванием.

Представьте себя на месте пациента в данной ситуации. Допустим заболевание, о котором идет речь, смертельно опасное, но и лечение очень дорогое и тоже с серьезными последствиями для здоровья. Например, это может быть онкология и химиотерапия.

Вы бы пошли лечиться по результатам такого теcта?
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Вы уже провели наблюдение с погрешностью 5%. Не устраивает диагноз - попробуйте увеличить количество наблюдений.
Ответить
Дмитрий Веселов
Так Вы пойдете лечиться или нет? Допустим другого теста нет, но Вы еще раз прошли это тест и получили тот же результат, пойдете лечиться?
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Давайте уйдем от софистики к математике. У вас есть монетка, вы её подкинули и она упала орлом. Какова вероятность, что она упала орлом? Почему не учитываете вероятность ожидания выпадения орла?
Ответить
Дмитрий Веселов
Так это же Вы начали с софистики, заговорили о метеоритах, монетках. Переходите к математике, пожалуйста, предоставьте решение задачи. Я то его знаю и Виктор Рассоха тоже знает, почти верно рассчитал (см. ниже).
А то, что Вы не различите фактические события (падающий метеорит или упавшая определенным образом монетка) от вероятного события (наличие заболевания), это очень плохо, для Вас же.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Проведено наблюдение результата измерений и оно показало наличие заболевания. Вероятность ошибки 5%.
Вы упорно игнорируете мои вопросы. Так что там с монеткой, уменьшать вероятность будете, да или нет?
Ответить
Дмитрий Веселов
Так какой ваш ответ? 5%? 95%? 100%?
В любом случае ни один из этих ответов не верен.
На ваш вопрос про монетку я уже ответил то, что Вы не понимаете разницу между известным фактом (упавшая монетка) и неизвестным (наличием заболевания). Про вероятность известного факта.. увольте, мне как-то неловко Вам отвечать..
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Мой ответ 95%. Я не говорю про факт, а про результат наблюдений. Тест на наличие болезни - это результат измерений, как и просмотр стороны упавшей монетки. Если вы на монетку с орлом посмотрите издалека, и вероятность ошибки будет 5%, то какова вероятность, что монетка лежит орлом вверх?
Ответить
Дмитрий Веселов
Ваш ответ верный по отношению к ситуации с монетками, которую Вы привели. Но условия задачи иные! Вы должны учитывать распространенность заболеваний. Попробую для Вас сформулировать условия на примере монеток, чтобы вам понятнее было. Допустим, Вы смотрите на целое поле монеток издалека. Вы видите орел или решку с точностью 95%, но при этом точно знаете, что только 1 из 1000 монет лежит решкой в реальности. И вот вы увидели монетку, которая лежит решкой. Какая вероятность того что она действительно лежит решкой, и Вам это не показалось?
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Да зачем же мне учитывать ожидание результата, если у меня уже есть сам результат. Если я увидел решку - то это решка с вероятностью 95%.
Дополню ответ: если я буду шагать к этой кучке монет, вероятность решки будет увеличиваться до 100% за счет снижения вероятности ошибки наблюдения. Т.е. вероятность выпадения одной из сторон не принимает участие в результатах измерения.
Ответить
Дмитрий Веселов
Ну... я могу сказать только то, что Вы решаете задачу не верно.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Итак, ваша оценка, что видимая мной решка лежит с другой вероятностью?
Ответить
Дмитрий Веселов
И так? ))
Если рассматривать ситуацию с монеткой в тех условиях, которые я написал выше (аналогичные с тестом на болезнь), то вероятность того, что монетка в реальности лежит решкой будет ~2%. И это не оценка, это математический результат.

Я понимаю, Вам кажется, что такое решение противоречит здравому смыслу. Но это говорит только лишь о том, что Вы не знакомы с вероятностной математикой.

Есть и еще более интересные задачи и их решения, вот, например:
https://ru.wikipedia.org/wiki/Парадокс_Монти_Холла
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Хорошо, я сделал 5 шагов и вижу решку с вероятностью 99,9%. Ваша оценка того, что монета лежит решкой вверх?
Ответить
Дмитрий Веселов
99,9% это контрольные условия для Dina Dubrovina. Предлагаю дать возможность ей ответить.
Вас устроит, если я дам ответ, если точность вашего зрения будет 99,5%, например?
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Это был промежуточный вопрос. Я, наконец ещё делаю шаг, беру монету в зубы и показываю в телешоу на всю страну, что это решка. Вы опять уменьшите вероятность этого события?
Ответить
Дмитрий Веселов
если точность вашего зрения будет 99,5%, то вероятность того, что уведенная вами решка будет решкой в реальности ~ 16,7%
если взяли монету в руки и со зрением у Вас все хорошо, то точность будет 100%, а искомая нами вероятность тоже будет 100%.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Вопросов больше не имею.
Ответить
Дмитрий Веселов
Это хорошо. Надеюсь, Вы сможете верно решить задачу.
Ответить
Виктор Рассоха
Мне кажется, при 99,5% вероятность будет 20,08%. Почему у вас получается 16,7?
Ответить
Виктор Рассоха
Нашел у себя потерянную единичку в расчете. :) Похоже, действительно, 16.75%
Ответить
Дмитрий Веселов
Хорошо, очень близко, но не точно.
Ответить
Виктор Рассоха
Да, пожалуй, вне зависимости от теста остается вероятность 1/1000, тогда 0.02098, или примерно 1/48
Ответить
Дмитрий Веселов
Тест имеет значение. Допустим, если его достоверность будет 99,99%, то результат будет координально иным. Но то, что вы делаете расчет, используя данные о распространенности - это верный путь.
Ответить
Дмитрий Веселов
Хочу Вам дать подсказку;
учитывайте что тест ошибается как на больных, так и на здоровых.
Ответить
Виктор Рассоха
Думаю, правильно будет считать следующим образом:
Вероятность того, что пациент болен по тесту: Pбт = 1 / [ложноположительные] (1000-95%)
Вероятность того, что пациент болен исходя из статистики: Pбс = 1/1000

Вероятность того, что болен: Pб = Pбт + Pбс - Pбт*Pбс = 0.02 + 0.001 - 0.00002 = 2.098%
Ответить
Виктор Рассоха
Уточненный ответ: 2.059%
К знаменателю в Pбт нужно добавить еще единичку, того самого несчастного заболевшего. )
Ответить
Дмитрий Веселов
У Вас ошибки в расчетах. Dina Dubrovina точнее.
Ответить
Виктор Рассоха
Вероятно, у вас с Диной получился ответ 1.96%, то есть вы не учитываете фактор Pбс. Мне кажется, его нужно суммировать с результатом теста.
Ответить
Дмитрий Веселов
Позднее отправлю Вам формулу расчета и разъяснения в личку.
Ответить
Dina Dubrovina
Вероятность, что пациент болен примерно 2-3%. Вопрос второй: как изменится вероятность, если тест повторить и он опять будет положительный?
Ответить
Дмитрий Веселов
Ваш ответ близок к правильному ответу, но не точен и вызывает сомнения относительно того, что Вы знаете как счичать.
Допустим достоверность теста будет 99,9%. Какова будет веротяность болезни?

В рамках решения задачи вопросом о повторении теста можно принебречь, на достоверность это не влияет.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Ребят, ну вы чего, пациент перед доктором уже пузыри пускает, а вы всё 2-3%.
Ответить
Дмитрий Веселов
Наличие симптомов не имеет значения для решения этой задачи, они могут быть, а могут и не быть.

Убрал из текста задачи упоминание о симптомах.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Хорошо, кардиограф показал,что сердце уже не тук-тук. Но он может и ошибаться в 5%. Пациент опять скорее жив чем нет?
Ответить
Дмитрий Веселов
Тут и считать нечего, 95% что мертв, исходя из имеющихся данных. Но этот пример никак не отражает проблему моей задачи, а именно проблему взаимосвязи между достоверностью теста и распространенностью заболевания. Вы эту взаимосвязь, вообще, не видите, не говоря уже о том, что рассчитать вероятность не можете.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
А чёй-та он мертв-то? Человек рождается с малой вероятностью смерти, а вы взяли и не учли тут этого. Вероятность наступления события есть?- Есть. Результат измерения есть? - Есть. Вероятность ошибки измерения есть? - Есть! Где взаимосвязь?
Ответить
Дмитрий Веселов
я же написал в ответе "исходя из имеющихся данных". если вы хотите, чтобы были учтены другие имеющие значение данные, включайте их в условия задачи.
Ответить
Dina Dubrovina
1. Ок более точный ответ если достоверность теста 95% вероятность 1,9%.
2. Допустим достоверность теста будет 99,9%. Какова будет веротяность болезни? 50%
Еще Вопросы?
Ответить
Dina Dubrovina
В реальной жизни повторый положительный тест (например в другой лаборатории) сильно увеличивает вероятность болезни. Для этого первый тест обычно делается недорогим и с меньшей точностью, а в случае положительного результата делают второй, более дорогой.
Ответить
Дмитрий Веселов
Да, конечно! Но к большому сожалению далеко не всегда так делают. Не так давно была статья о проблеме медицины в германии, даже там до 20%!!! (на память) диагнозов ставят неверных.
Ответить
Дмитрий Веселов
У меня кстати к Вам есть все-таки еще один вопрос. Мне интересно, Вы использовали "упрощенную" или полную формулу для расчета. Если не сложно, укажите вероятность при достоверности 95% с точностью не менее 2 знаков после запятой.
Ответить
Алексей Новиков
Вся ветка - какие-то гадания на кофейной гуще и вытаскивание цифр из рукава, сопровождающиеся раздуванием щек и пренебрежением элементарными объяснениями.
Неужели ни один оратор не имеет в своем образовательном багаже курса теории вероятности?
Отчего-то таких слов здесь не прозвучало.
Что ж, я не гордый, могу объяснить, как решить эту задачу не методом "пальцем в небо", а так, как учат на математическом факультете.
Итак, в теории вероятности существует понятие "условная вероятность", записывается "P(A|B)" - вероятность события А, при условии, что произошло событие B.
Эта задача как раз на вычисление условной вероятности.
Основная формула для расчета условной вероятности:
1) P(A|B) = P(A*B)/P(B)
Кстати, из этой формулы выводится другая, для расчета вероятности логического произведения (пересечения) двух событий, она нам тоже понадобится:
2) P(A*B) = P(A|B)*P(B)
Пусть событие А = тест показывает "болен",
а событие В = человек реально болен.
Из этих событий можно вывести так же события:
¬А = тест показывает "не болен",
¬В = человек реально не болен.
(Здесь "¬" это знак логического НЕ)
По условию задачи дано:
P(B) = 0,001 (Болен 1 человек на тысячу)
P(¬В) = 0,999 (Здоровы 999 человек из тысячи)
P(A|B) = 0.95 (Тест показывает "болен" только 95-ти процентам реально больных)
P(A|¬B) = 0.05 (Тест показывает "болен" 5-ти процентам реально здоровых)
Найти:
P(B|A) = ?
(Какова вероятность того, что человек реально болен, при условии, что тест показал "болен")

Решение:
По первой формуле:
P(B|A) = P(B*A)/P(A)
Нам не известно ни P(B*A), ни P(A), попробуем их найти:
P(B*A) = P(A*B) = P(A|B) *P(B)
P(A) = P(A*B) + P(A*¬B) = P(A|B)*P(B) + P(A|¬B)*P(¬B)
Подставляем в первую формулу:
P(B|A) = P(A|B) *P(B) / (P(A|B)*P(B) + P(A|¬B)*P(¬B))
Упростим её:
P(B|A) = 1 / (1 + P(A|¬B)*P(¬B)/ P(A|B) /P(B)
Подставляем сюда значения из условия задачи (они все там есть):
P(B|A) = 1 / (1 + 0,05*0,999/0,95/0,001) = 0,018664 (округленно)
или в процентах = 1,8664 %
Ответить
Дмитрий Веселов
Решение верное. Но я полагаю, большинству оно все равно не будет ясно, так как сама суть формул типа P(A|B) = P(A*B)/P(B) не ясна, они не выводяться сами по себе из поставленной задачи. Если тут и объяснять, то "на пальцах", без привлечения теории веротяности. Жалко то, что никому не интересно ))
Ответить
Виктор Рассоха
Алексей, спасибо за подробное объяснение, но есть два момента, которые мы обсуждали с Дмитрием в личке и либо я не прав, либо вы.

1) Точность теста является соотношением (истинно больные + истинно здоровые) / количество обследованных. Вводя в расчет 0.05 вы искажаете точность теста. Этого делать не следует.

2) Тест - это одно испытание, а мы имеем два - второе статистическая вероятность 0.001). Поэтому их необходимо суммировать.
Ответить
Алексей Новиков
Объяснять на пальцах или прочей картошке, как Чапаев в незабвенном фильме - не мой стиль. Я написал формулу, а тому, кто не понимает теории вероятности, достаточно просто подставлять в нее нужные ему значения.
Ответить
Алексей Новиков
Виктор,
1. Не понял выражения "Точность теста является соотношением (истинно больные + истинно здоровые) / количество обследованных."
Истинно больные + истинно здоровые - это есть все люди вообще. В результате бессмыслица какая-то получается. Либо уточните, что имели в виду.
2) Не стоит изобретать велосипед. Ситуация прекрасно описывается в терминах теории вероятности, все формулы уже давно выведены, терминология устоялась. Этот этап человечеством давно пройден и занесен в учебники. Ей богу, не стоит заморачиваться выдумывать что-то своё, просто изучите и применяйте. Это - условная вероятность, одно событие действительно зависит от другого, но общая вероятность вычисляется не сложением, а по формуле, приведенной выше.
Ответить
Виктор Рассоха
1) см. определение - 3.3. Точность: http://vmede.org/sait/?page=3&;id=Onkologiya_analiz_vasilev_2008&menu=Onkologiya_analiz_vasilev_2008

Возможно, что по этому пункту я не прав, не готов спорить.

2) Это не велосипед. Имеют место два испытания, и в итоге мы имеем не одну, а две вероятности, которые нужно сложить: P(A+B) = P(A) + P(B) - P(AB)
Ответить
Виктор Рассоха
точка с запятой сразу после '3&' в ссылке - лишняя.
Ответить
Алексей Новиков
Виктор, как бы мне вам потактичнее объяснить, что происходит...
Вот смотрите: в 17 веке двух знаменитых ученых Паскаля и Ферма заинтересовали подобные задачки и они таки их решили. И не просто решили - они создали математический аппарат для решения вообще ВСЕХ подобных задач (и этой тоже). Я в 20-м веке худо-бедно этот матаппарат изучил в ВУЗе и знаю, как решать такие задачи. Вы, в 21 веке набрели на интересную задачку и бросились ее решать на основе своего накопленного опыта, который к сожалению не включает в себя знаний о тех трудах Паскаля и Ферма (или лучше сказать - включает по принципу "слышал звон, но не знаю, где он"). Ваши стремления к поиску истины похвальны, но к сожалению вы пока даже не ориентируетесь правильно в ситуации. Вы конечно можете потратить массу времени действуя по принципу "сам разберусь", но максимум, чего вы достигнете - повторите путь пройденный Паскалем и Ферма еще 300 с лишним лет назад. Так стоит ли тратить молодость на то, что можно просто прочитать и понять за день?
Решение заданной задачи я уже написал, никакого иного решения "не на пальцах" у нее НЕТ.
Ваша формула P(A+B) не соответствует условию задачи (т.е. вы решаете какую-то другую задачу, не заданную здесь). Множество ситуаций, которое охватывает ваша формула, на самом деле БОЛЬШЕ заданного, поэтому значение вашего ответа больше правильного - и это логично, ведь вы решаете не ту задачу.
На этом я предлагаю нам с вами данную тему закончить, так как я не любитель лишних слов. Задача решена. Если вы хотите научиться грамотно решать такие задачи - вам в библиотеку за учебником по теории вероятности.
Ответить
Виктор Рассоха
Алексей, вы ответили на вопрос "Какова вероятность того, что пациент болен?" или "Какова вероятность того, что пациент болен по результату только одного теста?"
Ответить
Алексей Новиков
Виктор, я же говорю: вы решаете какую-то не ту задачу.
В условиях задачи предельно ясно сказано: есть один-единственный тест. Никаких ДВУХ тестов не существует. То, что реально болен 1 человек из тысячи - это никакой не тест, это жестко заданное условие задачи и конечно же я его учитываю. Да, это важно. Очень важно научиться удерживать себя от скоропалительных (и неверных) выводов, типа "если у нас 2 вероятности, то их обязательно нужно сложить". С вероятностями вообще-то можно и другие операции производить, вывод про сложение НИ ИЗ ЧЕГО НЕ СЛЕДУЕТ, взят с потолка. Не стоит выдумывать то, чего нет в условиях задачи (даже если очень хочется).
Вы можете упорствовать сколько угодно, но Паскаля и Ферма вам не перемудрить.
Ответить
Виктор Рассоха
Хорошо, видимо я не прав, спасибо за объяснение.
Ответить
Дмитрий Веселов
Алексей, Вы забавно пишите.. читать в удовольствие )) Мне кажется, что где-то я уже этот стиль видел в инете.
Ответить
Starter
Экспертная помощь стартапам
Данил Каримов
Ну, а по вашим расчетам что вышло?
Ответить
Дмитрий Веселов
Dina Dubrovina дала верный ответ.
Ответить
WiseMike
Телеграм-бот для мониторинга вебсайтов
Мартин Иден
в любом случае после теста распространенность заболевания не имеет значения.
Ответить
Дмитрий Веселов
вывод не верный! вероятность заболевания зависит и от результата теста, и от его достоверности, и от распространенности заболевания.
Ответить
Enotus
Простой и удобный сервис для ведения заметок
Денис 8583
Или я чего-то не понимаю или это бред какой-то. Если тест на 95% достоверен - то это по определению означает что если у тебя положительный результат то этому можно верить с вероятностью 0.95
При чем тут распространенность заболевания?
Тест зависит от погрешности оборудования /человеческого фактора (лаборанта) и тп
Если он меряет например количество эритроцитов - как на это влияет статистика по стране? Человек может только что из Африки вернулся… весь "горит" а вы ему -" не парься чувак - всего 2% что ты болен, так по формуле посчиталось".
Ответить
Дмитрий Веселов
Денис, Вы действительно кое-что не понимаете и в первую очередь то, что вера и вероятность - понятия не совместимые. Многие вещи по незнанию кажутся абсурдными, в то время как они в действительности соответствуют реальности, хоть и не очевидны.
Ответ "по науке" дал Алексей Новиков ранее. Я бы мог и "на пальцах" (картошке) объяснить, но воздержусь, ради актуальности темы.
Ответить
Дмитрий Веселов
Что-то как-то слабо у стартаперов с анализом и математикой!
Ответить
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.