Почему извлечь пользу из big data получается не у всех?

РБКBiznes

Принять как данные

Автор: Оксана Гончарова

0:00 /
1029.799
Фото: ТАСС

Евгений и Татьяна вернут кредит с большей вероятностью, чем Ипполит и Барбара. Выйдя из отпуска, рабочие вдвое чаще подвергают себя риску производственной травмы… Анализируя большие данные, компании учатся выявлять подобные скрытые закономерности, улучшая свои бизнес-показатели. Направление модное, но извлечь пользу из big data получается не у всех. Причина — отсутствие в компаниях культуры работы с ними.

«Чем более распространенное имя у человека, тем выше шанс, что он заплатит вовремя. Чем больше этажей в твоем доме, тем статистически ты более хороший заемщик. Знак зодиака почти не влияет на вероятность возврата денег, а вот психотип — значительно», — рассказывает о неожиданных закономерностях в поведении заемщиков аналитик Банка Хоум Кредит Станислав Дужинский. Объяснить многие из этих закономерностей он не берется — их выявил искусственный интеллект, обработавший тысячи профилей клиентов.

В этом сила аналитики big data: проанализировав огромный объем неструктурированных данных, программа может обнаружить множество корреляций, о которых самый мудрый аналитик-человек даже не догадывается. У любой компании есть огромное количество неструктурированных данных (big data) — о сотрудниках, клиентах, партнерах, конкурентах, которые можно использовать с пользой для бизнеса: улучшить эффект от рекламных акций, добиться роста продаж, снизить кадровую текучку и т.п.

Первыми работать с big data начали крупные технологические и телекоммуникационные компании, финансовые организации и ретейл, комментирует Рафаил Мифтахов, директор группы технологической интеграции «Делойт», СНГ. Сейчас интерес к таким решениям есть во многих отраслях. Чего удалось добиться компаниям? И всегда ли анализ больших данных позволяет делать ценные выводы?

Нелегкий груз

Банки используют алгоритмы обработки больших данных прежде всего для улучшения качества обслуживания клиентов и оптимизации затрат, а также для управления рисками и борьбы с мошенничеством. «За последние годы в сфере анализа big data произошла настоящая революция, — говорит Дужинский. — Применение машинного обучения позволяет нам намного более точно прогнозировать вероятность невозврата кредита — просрочки в нашем банке составляют всего 3,9%». Для сравнения, на 1 января 2019 года доля ссуд с просроченными платежами свыше 90 дней по кредитам, выдаваемым физлицам, составила, по данным ЦБ, 5%.

Изучением больших данных озадачились даже микрофинансовые организации. «Предоставлять финансовые услуги без анализа больших данных сегодня все равно, что заниматься математикой без цифр, — рассуждает Андрей Пономарев, гендиректор платформы интернет-кредитования Webbankir. — Мы выдаем деньги онлайн, не видя ни самого клиента, ни его паспорта, и в отличие от традиционного кредитования должны не только оценить платежеспособность человека, но и идентифицировать его личность».

Сейчас в базе компании хранится информация по более чем 500 тыс. клиентов. Каждая новая заявка анализируется с учетом этих данных примерно по 800 параметрам. Программа учитывает не только пол, возраст, семейное положение и кредитную историю, но и то, с какого устройства человек заходил на платформу, как вел себя на сайте. Насторожить, например, может то, что потенциальный заемщик не воспользовался кредитным калькулятором или не поинтересовался условиями выдачи займа. «За исключением нескольких стоп-факторов — скажем, мы не выдаем займы лицам моложе 19 лет — ни один из перечисленных параметров сам по себе не является поводом для отказа или согласия в выдаче займа», — поясняет Пономарев. Важна именно совокупность факторов. В 95% случаев решение принимается автоматически, без участия специалистов отдела андеррайтинга.

Анализ big data позволяет выводить интересные закономерности, делится Пономарев. Например, пользователи iPhone оказались более дисциплинированными заемщиками, чем владельцы устройств на базе Android — первые получают одобрение заявок в 1,7 раза чаще. «То, что военнослужащие не возвращают кредиты почти на четверть реже, чем средний заемщик, не было неожиданностью, — говорит Пономарев. — А вот от студентов обязательности обычно не ожидают, а между тем случаи кредитных дефолтов у них встречаются на 10% реже, чем в среднем по базе».

Изучение больших данных позволяет проводить скоринг и для страховщиков. Работающая с 2016 года компания IDX занимается удаленной идентификацией личности и онлайн-проверкой документов. Эти услуги востребованы среди страховщиков грузоперевозок, которые заинтересованы, чтобы грузы пропадали как можно реже. Прежде чем застраховать перевозку товара, страховщик с согласия водителя проверяет его на благонадежность, поясняет Ян Слока, коммерческий директор IDX. Вместе с партнером — петербургской компанией «Контроль рисков» — IDX разработала сервис, который позволяет проверить личность водителя, паспортные данные и права, участие в инцидентах, связанных с утратой груза, и т.п. Проведя анализ базы водителей, компания выявила «группу риска»: чаще всего грузы пропадают у водителей 30–40 лет с большим водительским стажем, часто менявших в последнее время работу. Выяснилось также, что груз чаще всего воруют водители автомобилей, срок эксплуатации которых превышает восемь лет.

В поиске

У ретейлеров задача иная — вычислить клиентов, готовых совершить покупку, и определить наиболее эффективные способы привести их на сайт или в магазин. С этой целью программы анализируют профиль клиентов, данные из их личного кабинета, историю покупок, поисковых запросов и использования бонусных баллов, содержимое электронных корзин, которые они было начали заполнять, да бросили. Аналитика данных позволяет сегментировать всю базу и выделять группы потенциальных покупателей, которым может оказаться интересным то или иное предложение, говорит Кирилл Иванов, директор data-офиса группы «М.Видео-Эльдорадо».

Например, программа выделяет группы клиентов, каждой из которых нравятся разные маркетинговые инструменты — беспроцентный кредит, кешбэк или скидочный промокод. Эти покупатели получают email-рассылку с соответствующей акцией. Вероятность того, что человек, открыв письмо, перейдет на сайт компании, в этом случае значительно увеличивается, отмечает Иванов.

Анализ данных позволяет также повышать продажи сопутствующих товаров и аксессуаров. Система, обработавшая историю заказов других клиентов, выдает покупателю рекомендации, что можно купить вместе с выбранным товаром. Тестирование такого метода работы, по словам Иванова, показало увеличение количества заказов с аксессуарами на 12% и рост оборота аксессуаров на 15%.

Улучшить качество сервиса и повысить продажи стремятся не только ретейлеры. Летом прошлого года «МегаФон» запустил «умный» сервис предложений, в основу которого легла обработка данных миллионов абонентов. Изучив их поведение, искусственный интеллект научился формировать внутри тарифов персональные предложения для каждого клиента. Например, если программа отмечает, что человек активно смотрит на своем устройстве видео, сервис предложит ему расширить объем мобильного трафика. Учитывая предпочтения пользователей, компания предоставляет абонентам безлимитный трафик на их любимые виды интернет-досуга — например, на использование мессенджеров или прослушивание музыки в стриминговых сервисах, на общение в соцсетях или просмотр сериалов.

«Мы анализируем поведение абонентов и понимаем, как меняются их интересы, — объясняет Виталий Щербаков, директор по аналитике больших данных «МегаФона». — Например, в этом году трафик AliExpress вырос в 1,5 раза по сравнению с прошлым годом, и в целом количество заходов на сайты интернет-магазинов одежды растет: в 1,2–2 раза в зависимости от конкретного ресурса».

Другой пример работы оператора с большими данными — платформа для поиска пропавших детей и взрослых «МегаФон Поиск». Система анализирует, какие люди могли находиться рядом с местом пропажи человека, и рассылает им информацию с фотографией и приметами пропавшего. Оператор разрабатывал и тестировал систему совместно с МВД и организацией «Лиза Алерт»: в течение двух минут ориентировки на пропавшего получают более 2 тыс. абонентов, что значительно увеличивает шансы на удачный результат поиска.

Не ходите в ПАБ

Анализ больших данных нашел применение и в промышленности. Здесь он позволяет прогнозировать спрос и планировать продажи. Так, в группе компаний «Черкизово» три года назад внедрили решение на базе SAP BW, которое позволяет хранить и обрабатывать всю информацию по продажам: цены, ассортимент, объемы продукции, акции, каналы сбыта, рассказывает Владислав Беляев, директор по информационным технологиям группы «Черкизово». Анализ накопленных 2 Тб информации не только дал возможность эффективно формировать ассортимент и оптимизировать продуктовый портфель, но и облегчил работу сотрудникам. Например, для подготовки ежедневного отчета по продажам потребовался бы день работы множества аналитиков — по два на каждый продуктовый сегмент. Сейчас этот отчет готовит робот, тратя на все сегменты всего 30 минут.

«В промышленности большие данные эффективно работают в связке с интернетом вещей, — утверждает генеральный директор компании Umbrella IT Станислав Мешков. — На основе анализа данных с датчиков, которыми оснащено оборудование, можно выявлять отклонения в его работе и предотвращать поломки, спрогнозировать производительность».

В «Северстали» с помощью big data пытаются решать и довольно нетривиальные задачи — например, снизить показатели травматизма. В 2019 году на мероприятия по улучшению безопасности труда компания выделила около 1,1 млрд руб. В «Северстали» рассчитывают к 2025 году снизить уровень травматизма на 50% (по сравнению с 2017 годом). «Если линейный руководитель — мастер, начальник участка, начальник цеха — заметил, что работник выполняет те или иные операции небезопасно (не держится за поручни при подъеме по лестнице на промплощадке или не носит все средства индивидуальной защиты), он выписывает ему особое замечание — ПАБ (от «поведенческий аудит безопасности»)», — рассказывает Борис Воскресенский, начальник отдела анализа данных компании.

Проведя анализ данных о количестве ПАБов в одном из подразделений, специалисты компании выявили, что правила техники безопасности чаще всего нарушались теми, кто уже имел несколько замечаний раньше, а также теми, кто незадолго до инцидента находился на больничном или в отпуске. Нарушения в первую неделю после выхода из отпуска или с больничного оказались вдвое выше, чем в последующее время: 1 против 0,55%. А вот работа в ночную смену, как выяснилось, не влияет на статистику ПАБов.

В отрыве от реальности

Создать алгоритмы обработки больших данных — не самая трудная часть работы, отмечают представители компаний. Гораздо сложнее понять, как эти технологии можно применить в контексте каждого конкретного бизнеса. Именно здесь кроется ахиллесова пята аналитиков компаний и даже внешних провайдеров, которые, казалось бы, имеют наработанную экспертизу в области big data.

«Я часто встречал специалистов по анализу больших данных, которые были прекрасными математиками, но не обладали необходимым пониманием бизнес-процессов», — рассказывает Cергей Котик, директор по развитию компании GoodsForecast. Он вспоминает, как два года назад его компании довелось участвовать в конкурсе по прогнозированию спроса для одной федеральной розничной сети. Был выбран пилотный регион, по всем товарам и магазинам которого участники строили прогнозы. Затем прогнозы сравнивались с фактическими продажами. Первое место занял один из российских интернет-гигантов, известный своей экспертизой в машинном обучении и анализе данных: в своих прогнозах он показал минимальное отклонение от фактических продаж.

Но когда сеть стала изучать его прогнозы детальнее, выяснилось, что с точки зрения бизнеса они абсолютно неприемлемы. Компания представила модель, которая выдавала планы продаж с систематическим занижением. Программа поняла, как минимизировать вероятность ошибки в прогнозах: безопаснее занижать продажи, поскольку максимальная ошибка может составить 100% (отрицательных продаж не бывает), а вот в сторону перепрогноза она может быть сколь угодно большой, поясняет Котик. Другими словами, компания представила идеальную математическую модель, которая в реальных условиях привела бы к полупустым магазинам и огромным убыткам от недопродаж. В результате в конкурсе победила другая компания, чьи расчеты можно было применить на практике.

«Авось» вместо big data

Технологии больших данных актуальны для многих отраслей, но активное их внедрение происходит не везде, замечает Мешков. Например, в здравоохранении есть проблема с хранением данных: информации накоплено много и она регулярно обновляется, но по большей части эти данные еще не оцифрованы. Есть также много данных в госструктурах, но они не объединены в общий кластер. Разработка единой информационной платформы Национальной системы управления данными (НСУД) как раз направлена на то, чтобы решить эту задачу, говорит эксперт.

Впрочем, Россия — далеко не единственная страна, где в большинстве организаций важные решения принимаются на основе интуиции, а не анализа больших данных. В апреле прошлого года компания «Делойт» провела опрос среди более чем тысячи руководителей крупных американских компаний (со штатом от 500 человек) и выяснила, что 63% опрошенных знакомы с технологиями big data, но не имеют всей необходимой инфраструктуры, чтобы их применять. Между тем среди 37% компаний с высоким уровнем аналитической зрелости почти половина значительно превысили бизнес-цели за последние 12 месяцев.

Исследование выявило, что помимо сложности внедрения новых технических решений важной проблемой в компаниях является отсутствие культуры работы с данными. Не стоит ждать хороших результатов, если ответственность за решения, принятые на основе big data, будет возлагаться только на аналитиков компании, а не на всю компанию в целом. «Сейчас компании ищут интересные сценарии использования больших данных, — говорит Мифтахов. — При этом внедрение некоторых сценариев требует инвестиций в системы сбора, обработки и контроля качества дополнительных данных, которые ранее не анализировались». Увы, «аналитика — пока еще не командный вид спорта», — признают авторы исследования.

O'qishni davom ettirish uchun tizimga kiring. Bu tez va bepul.

Roʻyxatdan oʻtish orqali men foydalanish shartlari 

Tavsiya etilgan maqolalar

LG Electronics: Поэтическое путешествие LG Electronics: Поэтическое путешествие

Президент компании LG в России и СНГ — о жизни в стихах

РБК
Заповедные люди Заповедные люди

Зачем сотрудники Саяно-Шушенского заповедника бродят по глухой тайге?

Вокруг света
Борис Пиотровский: «Я помню его высокий рост и сильный голос» Борис Пиотровский: «Я помню его высокий рост и сильный голос»

Внук директора Эрмитажа Бориса Пиотровского унаследовал от деда культурный код

Seasons of life
Фтор: разрушающий или созидающий? Фтор: разрушающий или созидающий?

Написать эту заметку меня побудило желание рассказать об удивительном элементе

Наука и жизнь
В хорошей форме В хорошей форме

Совокупное состояние участниц рейтинга богатейших женщин страны — $9,9 млрд

Forbes
Геворк Вермишян: «5G — Это вызов, и мы его приняли» Геворк Вермишян: «5G — Это вызов, и мы его приняли»

Когда в России будет запущено пятое поколение мобильной связи?

РБК
Семейный взгляд Семейный взгляд

Сестры из Ростова-на-Дону создали бренд детской одежды

Forbes
«Пульс» зашкаливает «Пульс» зашкаливает

Как российский фармдистрибьютор за несколько лет вошел в первую тройку рынка

РБК
Деньги на счетах, а не в экономике. О чем говорит новый рейтинг РБК 500 Деньги на счетах, а не в экономике. О чем говорит новый рейтинг РБК 500

Крупнейшие компании России вдвое увеличили темпы роста выручки в 2018 году

РБК
Наука «Аполлонов» Наука «Аполлонов»

Научно-исследовательская работа «Аполлонов»

Наука и жизнь
Попали в окружение Попали в окружение

Дизайнеры Илья и Светлана Хомяковы оформили квартиру в Дюссельдорфе

AD
Свинушка — гриб, который нельзя есть дважды Свинушка — гриб, который нельзя есть дважды

Грибники хорошо знакомы с грибом свинушкой, или свинухой тонкой

Наука и жизнь
Любовь, лето, любовь Любовь, лето, любовь

Есть слова, которые можно повторять бесконечно

Seasons of life
Ростов папа Ростов папа

Ростовчане, распознав в тебе приезжего, сходу устроят тебе проверку

Seasons of life
Ни слова про арбузы Ни слова про арбузы

Астрахань похожа на игру в секретики

Seasons of life
Лондон, гуд‑бай Лондон, гуд‑бай

Декоратор Ираклий Зария оформил таунхаус в Лондоне

AD
Ягодки впереди. Как Wildberries стала лидером на рынке e-commerce Ягодки впереди. Как Wildberries стала лидером на рынке e-commerce

Крупнейший онлайн-ретейлер России родился из нежелания молодой мамы сидеть дома

РБК
Райский язык Райский язык

Мы поговорили с Мариной Степновой о детстве в Кишиневе и о суржике

Seasons of life
Две большие розницы: online vs offline Две большие розницы: online vs offline

Новые технологии и падение доходов изменили потребительское поведение россиян

РБК
Внутренняя энергия Внутренняя энергия

Общая рублевая выручка 200 частных компаний за год увеличилась на 22,2%

Forbes
Военный камуфляж Военный камуфляж

Дизайнеры Ариэль Эш и Рейналдо Леандро переделали бывшее военное общежитие

AD
Малышка на миллион Малышка на миллион

Самая богатая девушка в мире Кайли Дженнер показала свой дом в Лос-Анджелесе

AD
25 женщин-CEO 25 женщин-CEO

Список наиболее успешных руководительниц компаний российского бизнеса

РБК
В горах мое сердце В горах мое сердце

В Байдарской долине находится «вилла бьянка»

Seasons of life
Банковская пятилетка: консолидация, «Базель III» и уход в розницу Банковская пятилетка: консолидация, «Базель III» и уход в розницу

Последние годы кардинально изменили ландшафт банковского сектора

РБК
Авария в метро Авария в метро

Немецкий ретейлер Metro Сash & Carry сдает позиции и меняет форматы

Forbes
По следам Виллема Баренца По следам Виллема Баренца

История освоения Новой Земли

Наука и жизнь
Железное кольцо, сковавшее свободу Уэльса Железное кольцо, сковавшее свободу Уэльса

Строительства таких масштабов средневековый мир ещё не знал

Наука и жизнь
Привет из будущего Привет из будущего

Даниэль Либескинд рассказал о мебельном дизайне и архитектуре будущего

AD
Эпоха «Ренессанса» Эпоха «Ренессанса»

Группа «Ренессанс Страхование» делает ставку на InsureTech

РБК
Открыть в приложении