Телеком Анализ данных Маркетинг и CVM EW Marketing Platform

7,3% прирост в выручке благодаря ML-моделям: предиктивный маркетинг в Kcell

Eastwind разработала и запустила пять ML-моделей для оператора Kcell. Это позволило повысить точность таргетинга и усилить персонализацию. Оператор уже оценил эффективность на A/B-тестах по сравнению с сегментацией на основе бизнес-правил.
7,3% прирост в выручке благодаря ML-моделям: предиктивный маркетинг в Kcell

До старта проекта мобильный оператор Kcell уже использовал инфраструктуру для анализа больших данных и профиль абонента, ранее разработанный Eastwind. Чтобы еще больше увеличить конверсию офферов в маркетинговых кампаниях, мы разработали модели машинного обучения и интегрировали их с кампейн-менеджером EW AdTarget.

Задача: увеличить конверсию маркетинговых кампаний

На момент запуска проекта в Kcell уже использовали большие данные для управления клиентской ценностью (Customer Value Management):

  • данные агрегировались в Hadoop-кластере;
  • использовался профиль абонента, разработанный Eastwind;
  • функционировала внутренняя дата-команда.

При запуске кампаний в EW AdTarget специалисты ориентировались на профиль абонента, но логику выборки они настраивали вручную через бизнес-правила. Из-за этого точность таргетинга и конверсия были ниже, чем хотел оператор. Чтобы получать больше эффекта от больших данных, заказчик поставил такие задачи:

  • Увеличить выручку от кампаний за счет более релевантных офферов для абонентов.
  • Повысить лояльность абонентов благодаря выбору оптимального времени и канала коммуникации с клиентами.
  • Сократить отток, своевременно отправляя релевантные предложения клиентам с высоким риском ухода.
  • Увеличить выручку от продажи устройств, отправляя релевантные офферы абонентам с устаревшими моделями телефонов.

Для реализации нового проекта внутренних ресурсов оператора не хватало. Заказчик посчитал экономически эффективным привлечь специалистов Eastwind и не расширять штат своих сотрудников. Нашей задачей было разработать предиктивные ML-модели и интегрировать результаты с кампейн-менеджером EW AdTarget.

Для заказчика было важно как можно скорее запустить модели в прод. Мы приступили к проекту в октябре 2025, а через два месяца уже внедрили AutoML — технологию для автоматического обучения ML-моделей. Она позволяет сразу использовать их в работе, постепенно настраивая параметры в зависимости от результатов.

Как снизить отток клиентов

Узнайте о лучших практиках по предотвращению оттока от экспертов Eastwind

Получить книгу

Решение: разработать и внедрить в CVM-контур 5 ML-моделей

На начало проекта дата-инфраструктура и единый профиль абонента у Kcell уже были интегрированы в CVM-систему, и бизнес-пользователи могли бесшовно использовать их возможности в кампейн-менеджере EW AdTarget. Благодаря этому проект шел быстрее. Мы сфокусировались на создании витрины признаков, автоматическом переобучении моделей и их последующей интеграции. Аппаратное обеспечение тоже было установлено ранее, что дополнительно сэкономило время на реализацию.

На всех этапах разработки мы логировали и контролировали метрики, чтобы при необходимости можно было сравнить параметры или масштабировать ML-модели.

Ядро Hadoop-кластера
Для разработки, обучения и эксплуатации моделей использовали инфраструктуру на базе Hadoop-кластера

Создание витрины признаков

Kcell уже работал с профилями абонентов, но мы дополнительно провели аудит существующих витрин. Структура данных за время эксплуатации изменилась, а для корректного обучения моделей критична согласованность расчетов.

Мы разработали единую витрину признаков для всех ML-моделей. В нее вошли:

  • тарифы и услуги;
  • использование трафика (голос, интернет, сообщения);
  • финансовая информация и история платежей;
  • данные о девайсах и смене устройств;
  • атрибуты активности;
  • логи посещения сайтов.

Витрина формируется автоматически по расписанию и проходит встроенные проверки, чтобы обеспечить достоверность и точность прогнозов. Для обучения конкретных моделей мы предусмотрели фильтры, чтобы исключить ошибки и обеспечить стабильность результатов.

Автоматическое переобучение ML-моделей

Чтобы модели оставались актуальными при изменении поведения абонентов, мы внедрили AutoML-контур. Переобучение запускается:

  • по расписанию;
  • при накоплении достаточного объема новых данных;
  • при снижении метрик качества ниже порога, предусмотренного в настройках.

Благодаря AutoML модели автоматически адаптируются к изменениям в поведении абонентов. Это экономит ресурсы команды оператора и позволяет быстрее реагировать на изменения.

AutoML
Переобучение моделей выполняется циклически и включает пять этапов. Если для нового тарифа, услуги или канала модель только создана и еще не обучена, она сразу попадает в список на переобучение

Внедрение ML-моделей

Мы разработали пять ML-моделей и интегрировали их в кампейн-менеджер EW AdTarget. Результаты анализа автоматически выгружаются в профиль абонента и используются как рекомендации. Бизнес-правила остаются на стороне команды маркетинга Kcell.

Достоверность ML-моделей мы измеряли метрикой качества — F1-score. Она представляет собой среднее между точностью (Precision) и полнотой (Recall) данных. F1-score может быть от 0 до 1, где 1 — это идеальная модель.

Виды ML-моделей, внедренных в Kcell
ML-модель Что предсказывает Для чего нужна
Churn prediction Отток абонентов по критерию неактивности Превентивные офферы
NBO (up-sell) Один лучший тариф Офферы с механикой up-sell
Device Change Вероятность покупки нового устройства Офферы по обновлению устройств
Next Best Channel Релевантный пуш-канал для коммуникации Выбор пуш-канала
Next Best Time Лучший временной интервал для оффера Выбор времени для отправки сообщения

Churn prediction

Модель предсказывает отток абонентов по критерию неактивности в трех горизонтах: 30 дней, 7 дней, 1 день.

Бизнес-задача модели — снизить отток абонентов благодаря раннему выявлению клиентов с высоким риском ухода и точечному воздействию на них. Это поможет сохранить выручку и укрепить лояльность клиентов.

Критерий неактивности — отсутствие платных событий за 31 день:

  • нет пополнений баланса;
  • нет исходящей активности;
  • нет генерации трафика;
  • нет списаний в рамках тарифа.
Результаты стресс-тестирования моделей Churn Prediction на свежих исторических данных: чем ближе результат к 1, тем точнее прогноз
Горизонт предсказаний Precision (точность) Recall (полнота)
1 день 0,843 0,341
7 дней 0,707 0,824
30 дней 0,726 0,825

Next Best Offer

В этом проекте ML-модель выбирает один тариф из списка, заранее заданного заказчиком. Рекомендация для абонента строится с учетом четырех параметров: ARPU, объема потребляемого трафика, скидок, вероятности подключения.

Бизнес-задача модели — увеличить доход мобильного оператора благодаря продвижению более дорогих тарифов тем, кто активно пользуется услугами. Это поможет заказчику увеличить выручку и удерживать клиентов через расширение потребления.

Для более точного продвижения команда Eastwind разделила модели на две категории и внутри каждой разработала модели для отдельных тарифов:

  • несемейные — 11 моделей,
  • семейные — 7 моделей.

При разработке NBO-моделей мы обнаружили, что одни и те же услуги были по-разному представлены в разных системах заказчика. Из-за этого модель могла давать неточные рекомендации.

Мы унифицировали представление тарифов и изменили логику сопоставления справочников, чтобы рекомендации стали корректными и пригодными для CVM-кампаний.

Результаты стресс-тестирования моделей NBO на свежих исторических данных: чем ближе результат к 1, тем точнее прогноз
Тариф Precision (точность) Recall (полнота)
Тариф 1 0,91 0,87
Тариф 2 0,84 0,80
Тариф 3 0,87 0,82

Device Change

Модель предсказывает вероятность, с которой абонент купит новое устройство в двух горизонтах: 30 дней и 90 дней.

Бизнес-задача модели — увеличить продажи устройств с помощью выявления пользователей, склонных к их замене. Это поможет повысить конверсию офферов в продажу девайсов и сервисов.

Чтобы сузить целевую аудиторию, мы исключили из выборки устройства, которые не являются телефонами: планшеты, умные часы, модемы и т. д. В качестве критерия использовали дату, когда устройство впервые появилось сети. Дата определяется на основе идентификатора IMEI.

В анализ мы отобрали три категории абонентов:

  • с активностью в течение последних 30 дней;
  • подключенных к сети больше 90 дней назад;
  • не менявших устройство последние полгода.
Результаты стресс-тестирования моделей Device Change на свежих исторических данных: чем ближе результат к 1, тем точнее прогноз
Горизонт предсказаний Precision (точность) Recall (полнота)
30 дней 0,91 0,87
90 дней 0,84 0,80

Next Best Channel

ML-модель выбирает наиболее удачный пуш-канал для коммуникации с абонентом.

Бизнес-задача модели — увеличить количество положительных откликов на взаимодействие, чтобы повысить конверсию офферов.

Мы анализировали ответы абонентов по каналам коммуникации из кампейн-менеджера EW AdTarget:

  • SMS — с разделением логики для разного рода кампаний,
  • DSTK (Dynamic SIM Toolkit),
  • голосовой робот,
  • пуш в мобильное приложение.
Результаты стресс-тестирования моделей Next Best Channel на свежих исторических данных: чем ближе результат к 1, тем точнее прогноз
Канал Precision (точность) Recall (полнота)
SMS 0,715 0,815
DSTK 0,649 0,776
Голосовой робот 0,729 0,657
Пуш 0,692 0,674

Next Best Time

Модель определяет наиболее удачный промежуток времени для коммуникации с абонентом.

Бизнес-задача модели — увеличить количество положительных откликов от абонентов и улучшить их пользовательский опыт.

Для анализа мы отобрали только тех абонентов, с которыми была коммуникация за последние 30 дней и ответ по которой зафиксирован в EW AdTarget. Для почасового прогноза оказалось недостаточно входных данных, поэтому мы выбрали три промежутка времени:

утро: 9-11 ч • день: 12-17 ч • вечер: 18-20 ч

Затем мы проанализировали поведение абонентов в разные дни недели, выявили схожие и отличительные черты. В итоге интервалы для коммуникаций остались примерно одинаковыми по длительности, но внутри каждого мы задали разные настройки.

Рабочие дни:

  • пн-пт: 9-12 ч
  • пн-пт: 12-18 ч
  • пн-чт: 18-21 ч
  • пт: 18-21 ч

Выходные дни:

  • утро: 9-12 ч
  • день: 12-18 ч
  • сб-вс: 18-21 ч

Тесты заказчик проводил на первоначальных значениях.

При выборе временных интервалов мы также учли регуляторные ограничения, по которым коммуникации с абонентами разрешены только с 9:00 до 21:00.

Результаты стресс-тестирования моделей Next Best Time на свежих исторических данных: чем ближе результат к 1, тем точнее прогноз
Временной интервал Precision (точность) Recall (полнота)
9-11 ч 0,654 0,825
12-17 ч 0,723 0,920
18-21 ч 0,749 0,903

Результат: 5 ML-моделей в проде за месяц и прирост к выручке до 7,3%

Первым этапом клиенту было важно разработать ML-модели и запустить их в эксплуатацию, чтобы оценить первоначальную эффективность. Вторым этапом — провести тюнинг моделей с учетом результатов A/B-тестирования.

На первом этапе команда Eastwind за месяц:

  • собрала витрину признаков;
  • рассчитала параметры ML-моделей;
  • обучила модели;
  • запустила модели в работу в режиме AutoML.

После этого мобильный оператор провел первые кампании с использованием ML-моделей и оценил результаты их работы.

Тесты проводили на однородных группах абонентов:

  • группа сформирована по рекомендациям ML-модели;
  • группа собрана по бизнес-правилам специалиста.

При тестировании модели Churn Prediction одной группе отправляли оффер по рекомендациям модели, второй — ничего. А для оценки Device Change для сравнения взяли ML-модель, используемую клиентом ранее.

Результаты работы ML-моделей в Kcell

На втором этапе мы добавили в список каналов двух голосовых роботов для коммуникации с абонентами, в том числе, «умного». Он может строить диалог, подбирать стиль и голос для общения с абонентом. Мы обновили витрину признаков по результатам первых тестов и усовершенствовали гиперпараметры ML-моделей.

От проекта по разработке предиктивных ML-моделей нам важно было быстро достигнуть реальных бизнес-результатов. Итоги сотрудничества с Eastwind превзошли наши ожидания: за месяц мы получили пять ML-моделей в проде, +7,3% прирост к выручке и снизили отток на 10,4%.

Аскар Дуйшеналиев
Аскар Дуйшеналиев Директор по монетизации данных, Kcell

Kcell получил не просто набор моделей, а масштабируемую ML-инфраструктуру, интегрированную с действующей CVM-системой. Модели постоянно проходят контроль качества и переобучаются для повышения точности прогнозов.

Внедрение AI & ML от Eastwind

Запишитесь на консультацию, если планируете внедрить ML-модели

Узнать подробнее
Этот сайт зарегистрирован на wpml.org как сайт разработки. Переключитесь на рабочий сайт по ключу remove this banner.