RT.DataLake
Мощный и гибкий инструмент для организации эффективного корпоративного хранилища данных
Оставить заявкуКакие задачи решает
Построение корпоративного хранилища больших данных
Использование неструктурированной и слабо структурированной информации
Ключевые функции
Актуальные и стабильные версии компонент
Гибкая кастомизация сборки дистрибутива
- Возможность выбора компонентов (в том числе новых) и их версий
- Возможность обновления версий отдельных компонентов
Управление компонентами RT.DataLake
- Автоматическая установка кластера, благодаря собственным ansible-скриптам
- Мониторинг и отслеживание состояния каждого компонента системы
- Возможность гибкого масштабирования
Функции управления безопасностью (настройка ролевой модели)
- Керберизация кластера
- SSL
- Aудит
Преимущества
Кейсы
Реализация Централизованного хранилища данных в ПАО «Ростелеком»
Построение корпоративного хранилища данных, которое смогло бы объединить данные из всех систем-источников и локальных хранилищ данных и сделать их консистентными и удобными для построения консолидированной отчётности
Технологии:
Data Warehouse Data Engineering
Решение:
Централизованное хранилище данных (ЦХД) — специальным образом организованный массив данных Ростелекома, обрабатываемый и хранящийся в едином аппаратно-программном комплексе, который обеспечивает быстрый доступ к оперативной и исторической информации, единую модель данных и единую интерпретацию рассчитываемых показателей, многомерный анализ данных, получение прогнозов и статистики для оптимального принятия управленческих решений.
Основным программным обеспечением ЦХД является собственная разработка компании — Платформа управления данными.
Эффекты:
- Крупнейшее отраслевое хранилище данных в России > 7пб, в т.ч. Аналитический контур объёмом более 600 ТБ.
- Крупнейшее отраслевое хранилище данных в России — экономия ~600млн ₽ за счёт отказа от использования стороннего ПО и перехода на ПО собственной разработки
Анализ эффективности рекламы на основе логов телесмотрения и данных о покупках
Организовать регулярную оценку рентабельности рекламных кампаний на ТВ с целью эффективного перераспределения бюджета и определения сильных и слабых каналов продвижения
Технологии:
Data Warehouse Data Engineering
Решение:
В рамках предоставления услуг IPTV Ростелеком накапливает по каждому клиенту статистическую информацию о времени включения телевизора и просматриваемых каналах. При наличии сетки выхода рекламных ТВ роликов эти данные дают возможность выявлять клиентов, у которых телевизор был включен в момент трансляции рекламы, рентабельность которой необходимо оценить.
На основе информации из чеков ОФД, включающих рекламируемый товар без привязки к ритейлеру и другим параметрам покупки и обогащенных идентификаторами клиентов, рассчитывается процент пересечения клиентов, купивших товар, с пользователями IPTV, смотревшими рекламный ролик. Проценты пересечения рассчитываются в разрезе регионов и поло-возрастных групп. Эти агрегированные показатели пересечения служат оценкой влияния ТВ рекламы на продажи.
Эффекты:
Оптимальное перераспределение рекламных бюджетов на базе оценки влияния ТВ-рекламы на продажи
Построение рекомендательных моделей продаж на базе искусственного интеллекта в сегментах B2B, B2C
Увеличить конверсию продаж за счёт использования индивидуальных рекомендаций, адаптированных к потребностям каждого клиента и учитывающих историю клиентского опыта
Технологии:
Data Warehouse Data Engineering Data Science
Решение:
Для решения задачи в ПАО Ростелеком построена система из нескольких сотен рекомендательных моделей на базе искусственного интеллекта, учитывающая все накопленные компанией знания о клиенте, как внутренние — например, обращения клиента в техническую поддержку, профиль использования услуг компании, адресная информация и др., так и полученные из внешних источников — например, данные социальных сетей, ЗАГС и др.
На основе анализа данных о клиенте модели помогают получать информацию о его потребностях и предпочтениях и при дальнейшем общении с клиентом позволяют предложить именно тот продукт, который с высокой вероятностью окажется ему полезен.
При этом не тратится время на предложение продуктов, в которых клиент не нуждается.
Эффекты:
Использование рекомендательных моделей продаж позволило повысить конверсию продаж в 2–3 раза для существующих и новых клиентов ПАО Ростелеком
Построение моделей оттока на базе искусственного интеллекта в сегментах B2B, B2C
Своевременно выявлять клиентов в сегментах B2C, B2B, которые могут перестать пользоваться услугами компании в ближайшем будущем, с целью предотвращения их оттока
Технологии:
Data Warehouse Data Engineering Data Science
Решение:
Для решения задачи в ПАО Ростелеком построена система из нескольких десятков моделей на базе искусственного интеллекта, учитывающая все накопленные компанией знания о клиенте, как внутренние — например, обращения клиента в техническую поддержку, профиль использования услуг компании, адресная информация и др., так и полученные из внешних источников — например, данные социальных сетей, ЗАГС и др.
Модели позволяют предсказать вероятность оттока клиента на горизонте 3 месяца и, следовательно, дают время для принятия мер с целью его удержания. Помимо вероятности оттока модели определяют причины, по которым клиент может уйти, что даёт возможность разработать на их основе возможные сценарии удержания, улучшающие клиентский опыт.
При реактивном удержании модели формируют рекомендации на основе финансовых критериев, эффективно или нет в данном случае применять ценовое удержание.
Эффекты:
Предсказывание оттока позволяет заблаговременно начать удержание склонных к оттоку клиентов. Из реально склонных к оттоку удерживается 20% клиентов в сегментах B2C и B2B
Миграция корпоративного озера данных с web-трафиком Теле2 на RT.DataLake
Снижение стоимости эксплуатации озера данных на фоне существенного увеличения требуемой ёмкости, решение задач импортозамещения и сохранения эффективности работы существующих сервисов монетизации «больших данных»
Технологии:
Data Warehouse Data Engineering
Решение:
Миграция с Cloudera Data Platform 6 на отечественный продукт Rt.DataLake. В результате внедрения Rt.DataLake в Теле2 организован кластер Hadoop полезной ёмкостью 0,8 Петабайт, с ежедневным объёмом интегрируемых данных 100 Терабайт.
- Повышены доступность, актуальность и качество данных для бизнеса
- Увеличена скорость подготовки отчётности и, как следствие, скорости принятия управленческих решений: на данных ЦХД выполнено более 300 бизнес-проектов
- Сокращены затраты на поддержку и развитие витрин/отчётности за счёт централизации функционала, гармонизации набора технологий работы с данными при миграции нецелевых хранилищ в ЦХД
- Возможность быстрого анализа, построения пилотных моделей за счёт наличия песочницы для бизнеса с доступом ко всем аналитическим данным для подготовки быстрой аналитики (без привлечения служб ИТ
- Все компоненты платформы управления данными, лежащий в основе ЦХД, зарегистрированы в реестре отечественного ПО и удовлетворяют требованиям импортозамещения
Эффекты:
- Экономия 3 млн $ на горизонте 5 лет
- Исключение валютных и санкционных рисков
- Независимость от иностранного ПО
- Кастомизация ПО
- Снято ограничение на масштабирование текущего решения. Увеличение вычислительных мощностей без роста стоимости лицензий
- Самые свежие и стабильные версии OS-компонент
Напишите нам
Мы ответим на ваши вопросы