Ключевые разделы:
Основы RFM‑анализа
RFM‑анализ (recency, frequency, monetary) — это подход к сегментации клиентов по трем осям: давности последней активности (Recency), частоте совершения транзакций (Frequency) и объему потраченных средств (Monetary). Эти показатели позволяют выявить поведенческие паттерны и сконцентрировать усилия на наиболее перспективных группах.Определения Recency, Frequency, Monetary и выбор горизонта
Recency — время с момента последней транзакции клиента до текущего момента или контрольной даты анализа. Frequency — количество транзакций в выбранном временном окне. Monetary — совокупная сумма расходов за период. Для корректного RFM‑анализа важно задать единый горизонт — обычно используют 6–12 месяцев, анализируя клиентов с подтвержденной историей покупок.Показатели Recency чувствительны к сезонным колебаниям спроса. В большинстве отраслей выбор периода зависит от типичной частоты покупок и цикла жизни товара. Если цикл слишком длинный, временной горизонт можно увеличить до 18–24 месяцев, чтобы не сокращать когорты неактивных пользователей.
Скоринг и бининг: квантильные пороги, шкала 1–5
RFM‑скоры назначаются с помощью квантилей: вся клиентская база делится на равные по объёму подгруппы по каждой из осей. Чаще используются 5-квантильные шкалы — каждому клиенту по каждому критерию присваивается балл от 1 до 5. Далее значения объединяются в RFM‑профиль (например, 5-1-3). Бининг решает две задачи: защищает анализ от выбросов и позволяет автоматически группировать клиентов для быстрого выявления паттернов.Скоры удобны для последующего сопоставления с метками JTBD‑сегментов, поскольку количество профилей ограничено и для каждой группы можно рассчитать признаки и средние значения. Важно помнить, что предельный состав сегментов сильно зависит от принятой шкалы: с ростом числа бинов увеличивается дисперсия групп, но теряется интерпретируемость.
Качество данных: события, дедупликация, окна активности
Точность RFM‑анализа критически зависит от чистоты событийной ленты. Необходимо устранять дублирующиеся транзакции, ошибки в датах, возвраты и исключать нетипичные массовые транзакции (например, тестовые покупки). Все неоднозначные события требуют стандартных правил обработки, чтобы снизить риск размывания сегментов.Для оценки Recency важно определять корректные окна активности. Если клиент совершал несколько транзакций в течение короткого периода, их нужно сгруппировать (например, все за сутки). Отдельно следует выделять неактивных клиентов — их поведение часто искажает средние показатели и требует дополнительных фильтров при построении модели.
Мост между RFM и JTBD
Объединение поведенческой и мотивационной сегментации начинается с формулирования рабочих гипотез: можно ли объяснить различия в RFM‑показателях вариациями в мотивации или сценариях использования?Формулирование гипотез соответствия работ поведенческим паттернам
Ключевой шаг — предположить, какие Job‑to‑Be‑Done связаны с высокими или низкими баллами по RFM. Например, высокая частота покупок может отражать эксплуатационный сценарий («регулярно пополнять расходники»), а высокая сумма — эпизодические, но крупные решения («решить комплексную задачу»).Построение таких гипотез требует знания продуктового контекста и предварительных наблюдений по клиентским интервью. Далее эти гипотезы верифицируются статистически — через сопоставление RFM‑профилей с самостоятельными метками Jobs. Важно включать в рассмотрение не только прямые, но и косвенные поведенческие проявления (например, скорость повторного заказа).
Инструменты сбора мотивационных меток: микроопросы, дневники, теги поддержки
JTBD‑метки можно присваивать разными способами. Самые распространённые методы — микроопросы после транзакции, дневники использования продукта и теги контактов с поддержкой. В микроопросах задают вопрос о цели последней покупки или сценарии использования. Дневники фиксируют детали реального поведения, что расширяет понимание мотивации.Техническая реализация сбора зависит от доступных каналов: мобильные пуши, письма, формы обратной связи. Аналитика тегов обращений в поддержку позволяет косвенно выделять Jobs, если клиенты напрямую сообщают о причинах использования. Для повышения достоверности полезно комбинировать методы и поддерживать постоянное обновление JTBD‑меток при изменении ассортимента или функционала.
Модели сопоставления
Центральная задача интеграции — количественно оценить взаимосвязь между поведением в терминах RFM и мотивационными Jobs. Для этого применяют методы от простых перекрестных таблиц до многомерных статистических моделей.Перекрестные таблицы и корреляции
На первом этапе используют кросс‑табуляции: строится двумерная таблица, где строки — скоры по RFM, столбцы — Job‑сегменты. Для каждой ячейки рассчитывают частоту и средние значения показателей. Такой анализ позволяет обнаружить неслучайные перекосы: например, что определенный Job‑сегмент чаще проявляет высокую Frequency.Для количественной оценки связи применяют коэффициенты корреляции (Крамера, Спирмена — для порядковых шкал). Важно помнить: высокая корреляция не означает причинно‑следственной связи. Перекрестные таблицы используются для первичного выявления взаимосвязей и обсуждения гипотез, но не для выводов о причинности или точном размере эффекта.
Логистическая и мультиномиальная регрессия для предсказания Job‑сегмента
Для проверки гипотез о связи RFM‑профиля с Job‑сегментом используют регрессионные модели. Если Job‑сегмент бинарный (например, «исправить срочную проблему» и все прочие), применяется логистическая регрессия — прогнозирует вероятность отнесения к сегменту по RFM‑баллам и дополнительным признакам.При наличии нескольких Job‑классов используют мультиномиальную регрессию. В обеих моделях проверяют значимость коэффициентов и оценивают величину эффекта для каждого профиля. Основное преимущество регрессионного подхода — учитывается вклад каждого RFM‑измерения раздельно. Диагностика проводится стандартными методами: ROC‑AUC, confusion matrix, кросс‑валидация на holdout‑выборках.
Кластеризация с ограничениями (semi‑supervised)
Если полный набор меток по JTBD получить сложно, используется semi‑supervised кластеризация. Задаются якорные точки (например, клиенты с подтвержденным Job), остальные распределяются по близости к ним в пространстве RFM‑скоров и добавочных признаков (например, канал привлечения, регион).Методы — constrained k‑means, кластеризация с использованием априорных центров, алгоритмы частичной разметки. Такой подход позволяет находить новые сегменты, которые не укладываются в исходные гипотезы. Оценка устойчивости — сравнение результатов кластеризации на разных временных срезах и с разными инициализациями центров.
Проверка и устойчивость выводов
Аналитика устойчивости — обязательный этап сопоставления RFM и JTBD: полученные взаимосвязи могут быть случайными или обусловлены сезонными эффектами.Holdout, пермутационные тесты, сезонность и смена ассортимента
Корректные выводы требуют разделения базы на тестовую и валидационную (holdout) выборки. Итоговые показатели — качество предсказания, величина эффекта, распределение Job‑сегментов для разных RFM‑групп — должны быть сопоставимы между срезами.Пермутационные тесты позволяют проверить устойчивость результатов: вычисляют показатели для набора случайных перестановок меток Jobs. Если для реальных меток показатели существенно выше, гипотеза подтверждается.
Сезонные колебания и ассортимент — два фактора, искажающих поведение. Зафиксированные межсегментные различия могут исчезнуть при запуске массовых промо или резкой смене портфеля продуктов. Корректно оценивать влияние этих факторов можно с помощью стратификации и дополнительного контроля (например, анализируя результаты от «чистой» выборки без влияния акций).
Локальные интерпретации: что считать доказательством
Результаты сопоставления RFM и JTBD‑сегментов следует трактовать осторожно. На практике корреляционные связи не являются доказательством причинности, если не проведено экспериментальное или квази‑экспериментальное сравнение.«База — не таблица имён, а живой актив». В постах — как сегментировать клиентов, оживить их и выстроить дожимы, чтобы они покупали снова.
Актульные темы с записей эфиров
13.03.25 - 98 минут
Регулярный менеджмент помогает командам ставить рекорды по метрикам.
Как из ленивой команды, которая перекладывает с полки на полку задачи, сделать спортивную, которая бьет рекорды из квартала в квартал.
Разбираем основные метрики отчета Monitor Analytics для руководителей и собственников.
смотрите >>
Практикум - 6 часов
Продажи без слива.
Потенциал в базе.
Узнаете, где спрятана прибыль в вашем проекте. Чёткие инсайты на основе цифр.
У вас достаточно данных. Чтобы найти как расти. За счёт правильной работы с базой пользователей и корректной аналитики — школы зарабатывают в разы больше. В разы — это 80% всего дохода с базы при крутом холодном трафике.
смотрите >>
120 минут
Как выиграть конкуренцию за внимание в email-рассылках и повысить доход?
Открываемость писем падает? Подписчики не читают ваши сообщения? Конверсии низкие, а расходы на email-маркетинг растут?
Eзнайте как повысить эффективность ваших email-кампаний, снизить затраты и увеличить продажи!
смотрите >>
130 минут
2025: что изменилось в продажах за 5 лет.
Стоимость трафика выросла в 3-5 раз. Конкуренция на рынке онлайн-школ увеличилась. Пользователи стали избирательнее и требовательнее.
Сегодняшние лидеры рынка используют новые стратегии, основанные на системной работе с базой. Именно про эти стратегии поговорили на вебе.
смотрите >>
90 минут
Не тот путь: опасные методики и токсичные тренды.
Как избежать тупиковых решений в маркетинге онлайн-школ и вовремя отслеживать негативные процессы.
Расскажу про новые опасности из разборов. 70% разборов 2024 года можно красить в красный цвет: выбран не тот путь развития и уже очень давно. Огромные обороты, а перестраиваться уже очень больно.
смотрите >>
Аналитика рассылок GetCourse
Подключите модуль «Рассылки» в Monitor Analytics и перестаньте работать вслепую: вся статистика писем, сегменты, конверсии и отписки собраны в одном отчёте. Сравнивайте кампании, находите точки роста и повышайте продажи за счёт грамотной работы с базой.
авторизуйтесь