«Хранилище Big Data должно быть не сложнее склада IKEA»

21.10.2019

«Хранилище Big Data должно быть не сложнее склада IKEA»
С каким объемом данных работает индустрия бизнес-туризма, проще всего объяснить на примере авиабилетов. Их оформление — основная услуга, которую оказывает «Аэроклуб», составляющая примерно 60% оборота компании. Вид авиационных билетов за последние 20 лет заметно изменился: сначала они были бумажными и выписывались от руки, потом стали электронными, но объем информации в них все это время продолжает оставаться огромным — это сотни строк. Для пользователей это не всегда очевидно, основной объем данных скрыт. По сути, в билете остается только та информация, которая требуется для выставления счета,— фамилия пассажира, название авиакомпании, данные рейса. Все остальное долгое время просто «выкидывалось». Так делали 100% компаний нашей отрасли — ничего необычного в этом не было. Понимание того, как это все может работать, пришло не сразу.

Пионерами использования Big Data в туристической индустрии были сервисы, ориентированные на массовую аудиторию. И очень долгое время мы, представители B2B-компаний, доказывали всем, что никакие B2C-технологии нам неинтересны. Казалось, это два разных полюса. Но в 2014 году ситуация изменилась. Начался кризис, в любой момент отрасль могла столкнуться с высокой конкуренцией за клиентов, и мы впервые задумались о персонализации собственных сервисов как о чем-то особенном, что можем предложить рынку. Тогда оказалось, что инструменты В2С могут работать и в сегменте В2В, прежде всего я говорю о технологиях подбора различных вариантов авиаперелетов. Ведь, по сути, разница не такая большая: контракт на перевозку всегда заключается между физическим лицом, например Ивановым, и авиакомпанией, например «Аэрофлотом». И физическому лицу нужно получить качественный сервис — неважно, предоставляет его В2С- или В2В-компания.

И когда мы наконец задумались о персонализации сервисов, выяснилось, что необходимых данных у нас нет. Хорошо еще, что сведения, которые когда-то казались лишними, мы не буквально «выбрасывали на помойку», а просто отправляли в архив. Когда мы их оттуда достали, остро встал вопрос технической организации процесса хранения и обработки данных. Сейчас многие компании заявляют о том, что у них есть Big Data. Честно говоря, верю я им далеко не всегда, а если говорить о сегменте делового туризма, то данными в полном объеме владеют буквально единичные игроки. Во всех остальных случаях это какие-то усеченные или вообще придуманные данные. Механизм тут достаточно простой: говорить о том, что все сведения собраны,— круто, а когда их приходится подтверждать — все можно придумать из головы. И доказать это очень сложно: маловероятно, что клиент залезет во внутреннюю кухню компании.

Но мы в «Аэроклубе» пошли честным путем. И могу точно сказать — этот процесс, во-первых, очень трудоемкий, а во-вторых, крайне дорогой. Перед тем как сформировать «озеро данных», так называемое Big Data Lake, мы должны их сначала собрать, а потом очистить, привести в состояние, в котором они смогут использоваться в рамках Business Intelligence (BI). Сначала нужно создать склад. Он должен быть устроен не сложнее, чем стандартный магазин IKEA, где, если вы выберете себе диван, сразу можете узнать, в каком складском стеллаже и на какой полке будут находиться все его комплектующие. На организацию процесса хранения и обработки данных ушло много времени: только в одном авиабилете сто с лишним полей, а в гостиничном бронировании ненамного меньше. Все это нужно соединять, правильно распределять и добавлять к этому данные, которые уже есть на стороне клиента.

Здесь остро встает проблема размера хранилища. Когда вы храните сто или тысячу трансакций — это один вопрос, но когда речь о нескольких миллионах, ситуация резко меняется. Нужен не один, не два и не три сервера, плюс они должны быть очень высокого качества, защищенные. Также нужно понимать, что поток данных у нас не кончается, каждая новая оказанная услуга, выписанный билет формируют дополнительный объем. По мере роста количества информации стоимость ее хранения постоянно растет. При этом прямой монетизации Big Data в нашей отрасли пока нет. Именно поэтому я редко верю небольшим компаниям, которые говорят о том, что у них есть Big Data. Как человеку, который работает на этом рынке, мне очевидно, что если чистая прибыль компании составляет 30–50 млн руб., то она вряд ли будет распределять их на направления, которые не приносят доход. При этом данные накапливают, и не вкладываться в их хранение просто невозможно. Поэтому трансакции не сохраняют, а если данные нужны для демонстрации клиенту — их придумывают.

Сейчас, по сути, мы монетизируем Big Data только косвенно, в рамках BI. Это очень интересная вещь, которая позволяет оперативно доставать и использовать информацию. Я люблю приводить один наглядный пример: имея определенные данные, мы сможем, обработав их, выявить прямое влияние восхода и захода солнца на стоимость авиабилетов. Конечно, на практике это вряд ли кого-нибудь заинтересует. Но речь о том, что любую, даже самую несуразную закономерность можно проверить, используя продукты на базе BI.

Проект для нас оказался непростым. Изначально он запускался как сервис для конкретного клиента, в котором мы сделали несколько интересных шаблонных решений. Когда мы начинали писать панели индикаторов, по сути, мы применяли BI в отчетах, где ранее традиционно использовался Excel. У последнего есть один большой минус — если объем больше чем 64 тыс. строк, сделать там ничего невозможно. У нас есть клиенты, которые подбираются к этому объему, и с ними приходилось достаточно непросто: файл тяжелый, его не так просто отправить, потом не так просто получить, а в итоге он просто у кого-нибудь не будет грузиться.

Когда вместо Excel мы предложили клиентам пользоваться нашим BI-инструментом АТОМ, стало очевидно, что этот продукт сильно помогает сотрудникам самой компании-клиента.

Например, приходит человек, ответственный в компании за тревел-направление, отчитываться на совет директоров и сразу с помощью планшета может показать, как структурируются расходы на командировки. Его спрашивают: а что если мы сократим эти траты на 5%? Он может ввести эти данные в шаблон и сразу смоделировать несколько возможных сценариев. То есть он может не заказывать отчеты в Excel и не сортировать их, а сделать все прогнозы в режиме реального времени за несколько секунд.

Сейчас технологии на базе Big Data, которые применяются в индустрии путешествий, намного превосходят свои аналоги во всех других областях. Посмотрев на это, многие удивляются: почему у нас тревел-технологии в космосе, а финансы на земле? Люди в других областях сразу начинают задумываться, как им достичь чего-то похожего. Поэтому, увидев, какое впечатление это произвело на клиента, мы подумали — почему бы нам не сделать в рамках Business Intelligence решения для самих себя? Первой разработкой стал алгоритм получения информации о трансакциях в режиме реального времени. То есть не постфактум из отчетов, а прямо сейчас мы можем видеть, что клиент купил слишком много билетов или, наоборот, слишком мало билетов и к чему все это приведет.

Этот проект стал отправной точкой — он хорошо показал, как грамотный анализ данных может помогать анализировать финансовые вопросы и рассчитывать будущие бюджеты. Соответственно, если что-то идет не так — мы можем сразу вносить коррективы, а не начинать махать топором в момент, когда сделать уже ничего нельзя. У многих игроков нашего рынка есть клиенты доходные и есть недоходные, получается, что одни дотируют других и вместе выходит ноль. «Аэроклуб» такой модели никогда не придерживался: очевидно, что такая система сломается, как только от вас уйдет крупный доходный клиент, объем бизнеса резко упадет. Мы всегда ориентировались только на доходных клиентов. Для этой бизнес-модели важно понимать, какие доходы приносит каждая конкретная компания в текущий момент. Получить такие данные нам удалось только при помощи Business Intelligence. Другое направление использования этого направления внутри компании — управление персоналом. Мы видим, сколько у каждого из сотрудников занимает конкретное бронирование, и можем планировать нагрузку. Например, грамотно распределять обращения, поступающие в наш контакт-центр,— система понимает, кто к нам обращается и что, скорее всего, ему потребуется. Так, если звонок раздается в три часа ночи, очевидно, что речь, скорее всего, идет об экстренном вызове. Если клиент использует наше мобильное приложение, по его геолокации легко предположить, с какой именно проблемой он столкнулся. Звонок поступает из аэропорта — понятно, что сложности произошли с запланированным конкретно этим человеком вылетом. А если человек в четыре утра пытается заказать от лица компании билеты — мы сразу знаем, разрешено ему это делать или нет. Никакой необходимости беспокоить во внеурочное время тревел-координатора не возникает.

Сейчас на базе BI-технологий мы стараемся сформировать для клиентов различные новые решения. Одним из них может стать платформа bleisure — от английских слов business + leisure, то есть совмещение работы, командировки и досуга. Наше мобильное приложение LINK, анализируя информацию сторонних сервисов, сможет предлагать клиентам варианты досуга в вечернее время. Например, человек отправляется в командировку, система предполагает, что его рабочий день завершится в семь часов вечера, и подсказывает, что уже в семь тридцать он сможет пойти на какой-то спектакль, посмотреть выставку или поужинать в хорошем ресторане. Одновременно мы стараемся максимально персонализировать технологию подбора авиабилетов, когда вместо двухсот возможных вариантов перелета клиенту на основе собранной о нем и других сотрудниках информации будет предлагаться одна ключевая опция. Причем вероятность попадания в пожелания клиента должна равняться 100% — это наша цель.

Сейчас основной задачей остается поиск возможности напрямую монетизировать хранение и обработку Big Data. Готового решения пока нет — очевидно, что только наших данных будет недостаточно. Но если добавить к ним информацию, например, от сотовых операторов, можно будет говорить о формировании нового и потенциально интересного для рынка продукта.

Кира Васильева

Источник: «Коммерсантъ»

Ноябрь 2019
ПнВтСрЧтПтСубВс
28
29
30
31
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
01
выбрать даты публикаций