Тренинги активных продаж. 5 шагов 8 ступеней: Каждый 10й твой! Или о законе вероятности в продажах

Теория вероятности – это наука, направленная на изучение случайных, не подлежащих строгому математическому описанию, событий и явлений, их свойств, закономерностей и взаимосвязей. Вся деятельность на финансовых рынках попадает под действие законов теории вероятности, так как большинство событий, происходящих на рынке, попадают под категорию случайных. Например, на рынке Форекс непрерывно заключается большое количество сделок и совершается торговых операций. Некоторые из них в дальнейшем приведут к убыткам, а другие могут принести определенную прибыль. Точно предсказать последствия совершаемых операций невозможно, так как их результат зависим от множества непредсказуемых факторов

Немного теории

Разбираться в теории вероятности — сложно. Чтобы разложить всё по полочкам, можно представить простой пример. Очень хорошо это получилось в одном из тредов на Stack Overflow.

Классификатор Байеса считается следующим образом:

A — событие или класс, а параметры — это свойства, по которым это событие или класс можно определить. Параметров может быть сколько угодно.

Чаще всего в исследовании используют набор параметров, предполагая, что они не зависят друг от друга. Классификатор называют наивным, поскольку обычно так не бывает: признаки одного предмета так или иначе связаны между собой.

Итак, представим, что у нас есть 1000 фруктов: 500 бананов, 300 апельсинов и 200 каких-нибудь ещё (это классы). Введём три определения: длинный, сладкий и жёлтый (это параметры). Занесём данные в табличку:

Класс Длинный Сладкий Жёлтый Всего
Банан 400 350 450 500
Апельсин 0 150 300 300
Другой 100 150 50 200
Всего 500 650 800 1000

Из общей корзины взяли один случайный фрукт. Наша задача — определить его, если мы знаем его параметры: он длинный, сладкий и жёлтый.

Сперва нужно посчитать вероятность того, что неизвестный фрукт — это банан. Получается, что нам необходимо вычислить P (банан I длинный, сладкий, жёлтый).

Считаем вероятности присутствия каждого параметра в классе:

P (длинный I банан) = 400/500 = 0.8

P (сладкий I банан) = 350/500 = 0.7

P (жёлтый I банан) = 450/500 = 0.9

P (банан) = 500/1000 = 0.5

Теперь, согласно уравнению, нам нужно перемножить все эти значения:

P (банан I длинный, сладкий, жёлтый) = 0.8 * 0.7 * 0.9 * 0.5 = 0.252

Поскольку нам предстоит сравнить вероятности трёх классов по одинаковым параметрам, то знаменатель в уравнении для каждого класса тоже будет одинаковым, его можно не считать.

Нужно проделать то же самое для других классов: апельсины и другие фрукты. Не будем мучить вас вычислениями: P (апельсин I длинный, сладкий, жёлтый) = 0, P (другой I длинный, сладкий, жёлтый) = 0.01875

Теперь наша задача сравнить полученные вероятности. Самый большой показатель — 0.252, то есть, согласно наивному байесовскому классификатору, взятый нами случайно длинный, сладкий и жёлтый фрукт — это банан.

Формула достаточно простая, но полезная. С её помощью можно определить предмет по его признакам, а сами вычисления несложно автоматизировать.

Вступление¶

В этом блокноте используется вычислительный подход к пониманию вероятности. Мы будем использовать данные Общего социального опроса (General Social Survey), чтобы вычислить вероятность таких предположений, как:

  • Если я выберу случайного респондента в опросе, какова вероятность, что это будут женщины?

  • Если я выберу случайного респондента, какова вероятность того, что он будет работать в банковской сфере?

Оттуда мы исследуем две взаимосвязанные концепции:

  • Конъюнкция, которая представляет собой совместную вероятность того, что оба утверждения верны; например, какова вероятность выбора женщины-банкира?

  • Условная вероятность, которая представляет собой вероятность того, что одно утверждение верно, при условии, что верно другое; например, учитывая, что респондент – женщина, какова вероятность того, что она банкир?

Я выбрал эти примеры, потому что они связаны с известным экспериментом Тверски и Канемана, которые задали следующий вопрос:

Линде 31 год, она незамужняя, искренняя и очень умная. По специальности философ. Будучи студенткой, она глубоко интересовалась проблемами дискриминации и социальной справедливости, а также участвовала в антиядерных демонстрациях. Что более вероятно?

  1. Линда – кассир в банке.
  2. Линда – кассир в банке и активный участник феминистского движения.

Многие люди выбирают второй ответ, предположительно потому, что он кажется более соответствующим описанию. Кажется маловероятным, что Линда будет просто кассиром в банке; если она кассир в банке, вполне вероятно, что она также будет феминисткой.

Но второй ответ не может быть “более вероятным”, как задается вопрос. Предположим, мы найдем 1000 человек, которые подходят под описание Линды, и 10 из них работают кассирами в банке.

Сколько из них тоже феминистки? Максимум, их 10; в этом случае оба варианта равновероятны.

Скорее всего, только некоторые из них феминистки; в этом случае второй вариант менее вероятен. Но не может быть больше 10 из 10, поэтому второй вариант не может быть более вероятным.

Ошибка, которую совершают люди, выбирая второй вариант, называется ошибкой конъюнкции или когнитивным искажением.

Это называется заблуждением, потому что это логическая ошибка, и “конъюнкция”, потому что “кассир в банке И феминистка” – это логическая конъюнкция.

Если этот пример вызывает у вас дискомфорт, значит, вы в хорошей компании. Биолог Стивен Дж. Гулд писал:

Мне особенно нравится этот пример, потому что я знаю, что [второе] утверждение наименее вероятно, но маленький гомункул в моей голове продолжает прыгать вверх и вниз, крича на меня, “но она не может быть просто кассиром в банке; прочитайте описание.”

Если человечек в вашей голове все еще недоволен, возможно, вам поможет этот блокнот.

пятница, 28 октября 2011 г.

Каждый 10й твой! Или о законе вероятности в продажах

Введение

     Теория вероятности – это наука, направленная на изучение случайных, не подлежащих строгому математическому описанию, событий и явлений, их свойств, закономерностей и взаимосвязей. Вся деятельность на финансовых рынках попадает под действие законов теории вероятности, так как большинство событий, происходящих на рынке, попадают под категорию случайных. Например, на рынке Форекс непрерывно заключается большое количество сделок и совершается торговых операций. Некоторые из них в дальнейшем приведут к убыткам, а другие могут принести определенную прибыль. Точно предсказать последствия совершаемых операций невозможно, так как их результат зависим от множества непредсказуемых факторов. Вероятность, в математической науке, определяется как некоторый критерий того – произойдет какое-либо событие или нет, выраженный в числовой форме. Вероятность может принимать значения от нуля (когда событие абсолютно невозможно), до единицы (когда событие обязательно наступит). Чаще всего степень вероятности отображают в процентах – от 0% до 100%. При проведении анализа и расчетов с применением теории вероятности используются знакомые математические действия – вероятности можно складывать и перемножать, только по особым правилам. Теория вероятности представляет собой мощнейший механизм прогнозирования рыночных взаимосвязей и отношений, управления вложенным капиталом для получения прибыли.

1. Классическое определение вероятности

Для начала надо вспомнить саму формулу, по которой будем считать. Итак, вероятность находится как $P=m/n$, где $n$ – число всех равновозможных элементарных исходов нашего случайного эксперимента с подбрасыванием, а $m$ – число тех исходов, которые благоприятствуют событию (то есть тому, что указано в условии задачи). Но как найти эти загадочные исходы? Проще всего пояснить на примерах.

Пример 1. В случайном эксперименте симметричную монету бросают дважды. Найдите вероятность того, что орел выпадет ровно один раз.

Итак, монету бросают дважды. Если обозначить буквой Р выпадение решки (цифры), а буквой О – выпадение орла (герба), то все возможные выпадения можно записать так: РР, ОР, РО и ОО (соответствено, выпали две решки, орел потом решка, решка потом орел и два орла). Подсчитываем число этих комбинаций и получаем $n=4$. Теперь из них надо отобрать только те, что удовлетворяют условию “орел выпадет ровно один раз”, это комбинации ОР и РО и их ровно $m=2$. Тогда искомая вероятность равна $P=2/4=1/2=0.5$. Готово!

Пример 2. Дважды бросают симметричную монету. Найти вероятность того, что оба раза выпала одна сторона.

Так как монета снова подбрасывается два раза, множество всех элементарных исходов эксперимента (или комбинаций, как мы их называем здесь для удобства), точно такое же: РР, ОР, РО и ОО, $n=4$. А вот условию “оба раза выпала одна сторона” удовлетворяют другие комбинации: РР и ОО, откуда $m=2$. Нужная вероятность равна $P=2/4=1/2=0.5$.

Как видим, все довольно просто. Перейдем к чуть более сложной задаче.

Пример 3. В случайном эксперименте симметричную монету бросают трижды. Найдите вероятность того, что орел выпадет ровно два раза.

Снова применим формулу классической вероятности. Шаг первый – выписываем все возможные комбинации уже для 3 бросков! Это будут: ООО, ООР, ОРО, ОРР, РОО, РОР, РРО, РРР. Смотри-ка, бросков всего на один больше, а комбинаций возможных уже $n=8$ (кстати, они находятся по формуле $n=2^k$, где $k$ – число бросков монеты).

Теперь из этого списка надо оставить только те комбинации, где О встречается 2 раза, то есть: ООР, ОРО, РОО, их будет $m=3$. Тогда вероятность события $P=m/n=3/8=0.375$.

Взяли разгон и переходим к 4 монетам.

Пример 4. Монету бросают 4 раза. Найти вероятность того, что герб выпадет от 2 до 3 раз.

Приступаем к вычислению. Шаг первый – выписываем все возможные комбинации для 4 бросков монеты. Чтобы проверить себя, сразу подсчитаем, что их должно получиться $n=2^4=16$ штук! Вот они:
OOOO, OOOP, OOPO, OOPP, OPOO, OPOP, OPPO, OPPP,
POOO, POOP, POPO, POPP, PPOO, PPOP, PPPO, PPPP.

Теперь выбираем те, где герб (он же орел, он же буква О) встречается 2 или 3 раза: OOOP, OOPO, OOPP, OPOO, OPOP, OPPO, POOO, POOP, POPO, PPOO, их будет $m=10$. Тогда вероятность равна $P=m/n=10/16=5/8=0.625$.

Думаю, к этому времени вы уже поняли суть метода и сможете сами решить задачи, где бросаются 2-3-4 монеты и орел не выпадает ни разу, или решка ровно один раз и т.п.

Правописание приставок

Повторение темы в 7 классе.

Банковское дело¶

Код для “Банковской и связанной с ней деятельности” – 6870, поэтому мы можем выбрать таких банкиров:

In [7]:

banker = (gss[‘indus10’] == 6870)

Результатом является логическая серия, которая представляет собой серию pandas, содержащую значения True и False.

Вот несколько первых записей:

Out[8]:

caseid1 False2 False5 False6 True7 FalseName: indus10, dtype: bool

Мы можем использовать values, чтобы узнать, сколько раз появляется каждое значение.

Out[9]:

counts
values
False 48562
True 728

В этом наборе данных 728 банкиров.

Если мы используем функцию sum в этой серии, она обрабатывает True как 1, а False как 0, поэтому общее количество – это количество банкиров.

Чтобы вычислить долю банкиров, мы можем разделить на количество людей в наборе данных:

In [11]:

banker.sum() / banker.size

Но мы также можем использовать функцию mean, которая вычисляет долю значений True в серии:

Около 1,5% респондентов работают в банковской сфере. Это означает, что если мы выберем случайного человека из набора данных, вероятность того, что он банкир, составляет около 1,5%.

Задание: Значения sex в столбце кодируются следующим образом:

1 Male2 Female

Следующая ячейка создает логическую серию, которая имеет значение True для респондентов-женщин и False в противном случае.

In [13]:

female = (gss[‘sex’] == 2)
  • Используйте values для отображения количества True и False значений у female.

  • Используйте sum, чтобы подсчитать количество респондентов-женщин.

  • Используйте mean, чтобы вычислить долю респондентов-женщин.

2 Анализ различных подходов к определению вероятности

     Вероятность любого события А определяется как сумма вероятностей всех элементарных событий, составляющих событие А, т.е. если использовать символику Р{А} для обозначения вероятности события А, то

 (1) 2

Отсюда следует, что всегда 0<Р{А}<1, причем вероятность достоверного события равна единице, а вероятность невозможного события равна нулю. Таким образом, для исчерпывающего описания механизма исследуемого случайного эксперимента (в дискретном случае) необходимо задать конечное или счетное множество всех возможных элементарных исходов и каждому элементарному исходу поставить в соответствие некоторую неотрицательную (не превосходящую единицы) числовую характеристику p, интерпретируемую как вероятность появления исхода (будем обозначать эту вероятность символами P{wi}). Вероятностное пространство является понятием, формализующим описание механизма случайного эксперимента. Задать вероятностное пространство – это значит задать пространство элементарных событий и определить в нем вышеуказанное соответствие типа:

(2) =P

Очевидно, соответствие типа (2) может быть задано различными способами: с помощью таблиц, графиков, аналитических формул, наконец, алгоритмически. Чтобы определить из конкретных условий решаемой задачи вероятности P{wi} отдельных элементарных событий используется один из следующих трех подходов.

    Априорный подход к вычислению вероятностей P{wi} заключается в теоретическом, умозрительном анализе специфических условий данного конкретного случайного эксперимента (до проведения самого эксперимента). В ряде ситуаций этот предопытный анализ позволяет теоретически обосновать способ определения искомых вероятностей. Например, возможен случай, когда пространство всех возможных элементарных исходов состоит из конечного числа N элементов, причем условия производства исследуемого случайного эксперимента таковы, что вероятности осуществления каждого из этих N элементарных исходов нам представляются равными (именно в такой ситуации мы находимся при подбрасывании симметричной монеты, бросании правильной игральной кости, случайном извлечении игральной карты из хорошо перемешанной колоды и т.п.). В силу аксиомы, вероятность каждого элементарного события равна в этом случае 1/N. Это позволяет получить простой рецепт и для подсчета вероятности любого события: если событие А содержит NA элементарных событий, то в соответствии с определением(3) 3

     Смысл формулы (3) состоит в том, что вероятность события в данном классе ситуаций может быть определена как отношение числа благоприятных исходов (т. е. элементарных исходов, входящих в это событие) к числу всех возможных исходов (так называемое классическое определение вероятности). В современной трактовке формула (3) не является определением вероятности: она применима лишь в том частном случае, когда все элементарные исходы равновероятны.

     Апостериорно-частотный подход к вычислению вероятностей Р{wi} отталкивается, по существу, от определения вероятности, принятого так называемой частотной концепцией вероятности. В соответствии с этой концепцией вероятность Р{wi} определяется как предел относительной частоты появления исхода в процессе неограниченного увеличения общего числа случайных экспериментов n, т.е. 

4. P

где mn(wi) – число случайных экспериментов (из общего числа n произведенных случайных экспериментов), в которых зарегистрировано появление элементарного события wi. Соответственно для практического (приближенного) определения вероятностей pi предлагается брать относительные частоты появления события в достаточно длинном ряду случайных экспериментов.

     Апостериорно-модельный подход к заданию вероятностей Р{wi}, отвечающему конкретно исследуемому реальному комплексу условий, является в настоящее время, пожалуй, наиболее распространенным и наиболее практически удобным. Логика этого подхода следующая. С одной стороны, в рамках априорного подхода, т. е. в рамках теоретического, умозрительного анализа возможных вариантов специфики гипотетичных реальных комплексов условий разработан и исследован набор модельных вероятностных пространств (биномиальное, пуассоновское, нормальное, показательное и т.п.). С другой стороны, исследователь располагает результатами ограниченного ряда случайных экспериментов. Далее с помощью специальных математико-статистических приемов исследователь как бы прилаживает гипотетичные модели вероятностных пространств к имеющимся у него результатам наблюдения (отражающим специфику изучаемой реальной действительности) и оставляет для дальнейшего использования лишь ту модель или те модели, которые не противоречат этим результатам и в некотором смысле наилучшим образом им соответствуют.

Результат

Мы запустили сценарий в апреле и получили следующие результаты:

До внедрения машинного обучения конверсия в поп-ап была 1,49%, после — 2,53% без потери количества лидов. Это отличные показатели.

Решебник по вероятности

А здесь вы найдете более 200 задач о бросании монет с полными решениями (вводите часть текста для поиска своей задачи):

Рейтинг
( 1 оценка, среднее 5 из 5 )
Загрузка ...