Интервью

RedSys: Традиционные СХД становятся слишком дорогими

Экспертиза RedSys
, Текст: Артур Галеев

Растущие объемы данных и та роль, которую они играют в современном мире, заставляет бизнес по-новому взглянуть на принципы хранения информации. Традиционные системы уходят в прошлое. Их сменяют революционные подходы, которые приносят ощутимые финансовые выгоды — прямые и опосредованные. О современных тенденциях в хранении данных CNews рассказал технический директор компании RedSys Александр Ланин.

CNews: Александр, с каждым годом все больше и больше возрастает роль современных технологий в бизнесе. Можно ли сказать, что зачастую выбор систем и типов хранения данных определяет исход конкурентной борьбы?

Александр Ланин: Человеку со стороны этот вопрос может показаться глубоко техническим, второстепенным, на бизнес-процессы никакого влияния не оказывающим. Многие думают, что главное — это концепт, подход, идея, товар. Ну, мало ли вариантов хранения, как это вообще может сказываться на чем-то? А оказалось, что именно этот момент, как верно было подмечено, часто решает судьбу миллионных вложений. Почему? Сейчас можно говорить о существовании двух основных принципов, двух аксиом. Первая — данные увеличиваются ежеминутно. Вторая — кто владеет данными, тот владеет миром. Обоснование этому есть, и оно простое: на хранящихся данных можно строить любую аналитику, а значит — продолжать зарабатывать. И мы знаем, что весь современный мир строится на зарабатывании денег.

CNews: Происходит эволюция отношения к данным.

Александр Ланин: Верно. В чем суть? Раньше существовал только один подход к хранению данных — реляционный. Концепция проста: записи структурируются в виде таблиц, и информация находится системой по определенным атрибутам. Проблема в том, что этой идее 30 лет, и данных тогда было куда меньше. И ведь мы не можем позволить себе удалять старые данные — они могут понадобиться в любой момент. Аналитики подсчитали, что объемы данных на нашей планете удваиваются каждые 18 месяцев, и темпы продолжают расти. Но, что важнее, эти данные перестают быть структурированными. И мир, в частности, бизнес, встал перед проблемой не только хранения, но и управления своими запасами различной информации. Да, можно хранить все на жестких дисках, постоянно увеличивать их число, но со временем эта архитектура становится тупиковой. Такие данные будет тяжело обрабатывать и, что важнее, анализировать. Ведь если твое хранилище становится медленным, то же самое происходит и с твоей аналитикой. Надо, например, добраться до какого-то конкретного файла, и ты по два дня сидишь, ждешь, пока сервер ответит. И чем крупнее бизнес, тем больше данных, а чем больше данных, тем медленнее происходит и обработка, и чтение, и изменение, и даже сама запись. Но разве крупный бизнес может позволить себе медлительность?

Так появился другой вариант — объектное хранение. Первое, что он дал — скорость. У объектов теперь нет атрибутов, а потому между ними не приходится выстраивать отношения, подобные тем, что существуют в реляционной модели. Есть идентификатор, и поиск осуществляется напрямую по нему. А раньше приходилось обращаться к СУБД. Другим плюсом таких систем стала их надежность. Частичная потеря данных больше не приводит к нарушениям структуры всей таблицы, а потому объекты, в которых не содержалась пропавшая информация, будут по-прежнему доступны.

Эти технологии сейчас признаны передовыми. Они появились в России не так давно, но достаточно популярны на Западе. По данным аналитиков IDC, в 2013 году объектные хранилища уступали файловым, но совсем немного, занимая 37% рынка. Согласно их прогнозам, уже через год объем этой части рынка составит $21,7 млрд. К слову, объектное хранение прочно вошло не только в жизнь бизнеса, но и в жизнь простых людей, нас с вами: кто из пользователей Google Drive или Dropbox задумывается, что в основе этих сервисов заложена именно та технология, о которой мы говорим?

CNews: Можно ли сказать, что на изменении подхода к хранению данных сказалось то, что на смену, грубо говоря, текстовым файлам, пришел медиа-контент?

Александр Ланин: У всех нас есть телефоны, которые что-то фотографируют, и мы потом этими снимками с кем-то делимся. Мы пользуемся инфограммами и переписываемся в рабочих чатах, выкладываем и загружаем. И да — эти данные тоже надо где-то хранить и каким-то образом анализировать. И для них традиционный принцип построения хранилища не подходит. Ведь все это находится в некоем облаке, будь то iCloud, или его аналоги от Android или Google. И нам приходится мириться с тем, что наша личная жизнь хранится не у нас на компьютере, а в этом облаке.

Когда в бизнесе заходит речь о необходимости создания облачного хранилища для медиа-контента, мы предлагаем решение на базе Ceph. Если вдаваться в подробности, то плюсов у этого варианта очень много. Оно доступно и дешево технологически, потому что использует в своей основе Linux. Оно не имеет единой точки отказа, что повышает сохранность критических данных. Оно помогает сэкономить на «железе». Например, у заказчика огромный «зоопарк» х86-серверов и он планирует от них избавляться. Вместо этого он может поставить на них очень интересное и очень производительное объектное хранилище.

Если серверов нет — не беда, они достаточно дешевые, как и все технологии x86-архитектуры. И тогда остается только одна проблема — размещение серверов. Их количество можно увеличивать линейно. Растет приток пользователей — ставим еще 10 серверов, увеличивается число терабайт данных — ставим еще 200.

CNews: Плюс ко всему, это же еще и Open Source?

Александр Ланин: Да, а потому обладает рядом серьезных преимуществ. Например, не привязано к железу определенного вендора, создает дополнительные возможности для масштабируемости и позволяет решать возникающие проблемы собственными силами без серьезных затрат на техническую поддержку. Но это касается всех разработок с исходным кодом. Конкретно Ceph отличает еще и равноправность всех узлов, что позволяет поддерживать высокую производительность. Само объектное хранилище по сути своей является файловой системой блочных устройств, а кластеры Ceph можно использовать как виртуализационную платформу.

Компания RedSys пришла к этой технологии два года назад, когда у заказчика возникло понимание необходимости отказа от импортного продукта. Предвосхищая вопрос об истории внедрений: можно уверенно говорить об одном проекте, который сейчас идет, мы занимаемся им второй год.

Александр Ланин: Объектное хранение данных позволяет бизнесу решить ключевые проблемы: нехватку скорости, медленную аналитику, невысокую надежность и низкую производительность

CNews: А какие есть варианты по размещению данных при использовании Ceph?

Александр Ланин: Приватные и публичные облака. Есть организации, которые предоставляют услуги размещения в публичных облаках. Тогда они размещают это все у себя в ЦОДе или некой комнате, которую можно с натяжкой назвать ЦОДом.

А если мы говорим о публичных облаках, то там масштаб ЦОДов просто астрономический. Но что самое важное, при использования объектного хранилища на базе Ceph можно линейно увеличивать необходимые мощности. Нет необходимости сразу строить мега-ЦОД и набивать его серверами. Есть возможность постепенного наращивания мощности без потери производительности. А это важно уже для пользователя, потому что определяет, как быстро он сможет скачать или загрузить свою фотографию или посмотреть потоковое видео.

CNews: А кто-то еще в России занимается внедрением Ceph?

Александр Ланин: Уже есть завершенные проекты, но их еще мало. Впрочем, конкуренции мы не боимся — она помогает нам самим становится лучше. Сейчас RedSys входит в число ведущих отраслевых системных интеграторов на российском ИТ-рынке. Если говорить в целом о наших партнерах, то среди них настоящие гиганты из самых разных секторов, от частного бизнеса до государственных учреждений. В разное время RedSys работал и продолжает работать с Пенсионным Фондом России, РЖД, X5 RetailGroup, «Объединенной металлургической компанией», компанией «ГАЗ», отелем «Метрополь». По этому списку самых разномастных партнеров можно сделать верный вывод о том, что RedSys сам достаточно многополярен. Наши решения охватывают и бизнес-приложения, и сферу информационной безопасности, и проектирование и внедрение сетевых систем, и высокопроизводительные вычислительные комплексы. В нашем портфеле более 70 вендорских договоров с ведущими мировыми поставщиками — от Novell и APC до Microsoft и IBM.

При этом, партнеров мы не бросаем, со всеми сотрудничаем по много лет. Этому способствует и качество нашей работы, и колоссальный опыт наших специалистов как в России, так и в других странах мира. Да и сам подход RedSys к внедрению и сопровождению проектов. У нас даже практикуется постпроектный анализ проведенных работ, что позволяет оценивать не только себя, но и существующие на рынке тенденции и предугадывать потребности заказчиков.

CNews: Кстати, о тенденциях. Как вы считаете, почему Россия отстала в технологиях хранения данных от Запада? Да и вообще — действительно ли это технологическое отставание или просто неготовность самого бизнеса к переменам?

Александр Ланин: Я могу ответить на этот вопрос и как отец, и как технический директор. Я не помню, чтобы десять лет назад моя дочь фотографировала себя в повседневный момент жизни и выкладывала этот снимок в тот же инстаграм. Он и подобные ему программы тогда были не так популярны и не так доступны или просто не существовали. У нас были серьезные ограничения по качеству интернета. Даже сейчас мы можем худо-бедно говорить о внедрении в России технологий 3G, но по всему миру уже тестируют 5G! Таким образом, если мы говорим о решениях для России, то причина нашего отставания в том, что интернет пока оставляет желать лучшего. Это первое.

Второе — неготовность нашего бизнеса кому-то передавать свои данные и хранить их не в приватных облаках. Страх, который, быть может, и не воплощается в реальность, но он все равно присутствует. Он диктует бизнесу позицию «мои данные всегда должны лежать у меня под боком». Выработка понимания, что хранение в чужом ЦОДе так же надежно, как и в своем собственном, — вопрос культуры и времени.

CNews: Давайте попробуем на примере. Приходит к вам в RedSys представитель крупного бизнеса. Что он хочет получить от современных технологий хранения данных?

Александр Ланин: Когда к нам приходят представители бизнеса, мы в первую очередь задаем типовые вопросы. Первый: что вы хотите хранить? Второй: как часто вы будете обращаться к этим данным? Третий: а где бы вы хотели хранить эти данные?

Ведь мы уже понимаем, что тип данных может быть такой, что заказчик вряд ли захочет размещать их в публичных облаках. Если он говорит, что хочет хранить данные у себя, то мы проговариваем вопросы по доступу и оперативности доступа к этим данным.

После этого нужно понять текущие объемы данных и их возможный прирост — годовой, квартальный, месячный, какой угодно. Если речь не идет о больших данных, можно просто построить хранилище внутри организации. При этом, обустроить так, чтобы в случае появления больших данных оно было легко масштабируемо и не отставало по производительности. Плюс на этом этапе можно решить определенные организационные моменты. Например, частая ситуация: кто-то внутри организации разослал письмо с видеороликом десяти адресатам, каждый из которых его скачал и сохранил в своей сетевой папке. Важно избегать повторения данных, не говоря уже о трафике который возникает в сети. Поэтому целесообразно провести аудит и выработать методику, при которой пересылается не сам файл, а ссылка на него. Это просто один из примеров.

Уже просто отвечая на все эти вопросы, заказчик начинает понимать, чего он хочет, какие решения ему нужны и что он от них получит. Соответственно, в процессе беседы мы предлагаем ему какие-то конечные варианты: или это ноу-хау, или стандартное enterprise-решение.

Александр Ланин: Сейчас можно говорить о существовании двух аксиом. Первая — данные увеличиваются ежеминутно. Вторая — кто владеет данными, тот владеет миром

CNews: Какими бизнес-понятиями оперируют ваши клиенты, делая выбор в пользу объектных хранилищ. Можно ли их как-то проиллюстрировать цифрами?

Александр Ланин: Цифры в каждом конкретном случае свои. Тут важнее понимать сам подход. Рассмотрим, например, банк. Каждого потенциального клиента просят заполнить ряд исчерпывающих анкет с целой кучей параметров: паспортными данными, показателями доходов, необходимо указывать чуть ли не маму с папой. И все это должно происходить: а) вживую, б) едва ли не каллиграфическим почерком, чтобы, не дай бог, это потом не было неверно интерпретировано. Многие клиенты могут потенциально отказываться от такого подхода, потому что «ну вас к черту, надоели, не буду я ни кредит брать, ни карточку открывать, пойду в другой банк, который будет ко мне более лоялен».

И появляются банки, которые говорят не «заполни анкету», а «пришли мне фото своего паспорта». Они сами все заполняют, и иногда не нужно даже личного присутствия клиента. Количество операций минимизировано. Получается, что такой принцип работы дает прямую выгоду в виде увеличения клиентской базы. Но: он меняет подход к хранению данных, ведь то самое фото паспорта — уже медиа-контент.

И вот тут уже надо вести конкретные подсчеты. Если оборот нашего условного банка 10 клиентов, а хранилище он изначально построил на сотни тысяч долларов, то это было невыгодно. Будь то Enterprise-решение или на базе Ceph. Но если есть стратегия захватить от сотни тысяч клиентов, то это уже другой разговор. Надо понимать, на какие бизнес-выгоды ты рассчитываешь и на какой рынок замахиваешься.

CNews: Какими критериями должен обладать бизнес, чтобы его владелец задумался об объектном хранилище?

Александр Ланин: Первое. Если у вас есть медиа-контент, то вам необходимо объектное хранилище. Потому что, если есть медиа-контент и объемы его увеличиваются, то использовать традиционные решения просто очень дорого. Когда к нам приходят такие компании, я им сразу рекомендую обратить внимание на технологии Ceph.

Второе. Какой у вас прирост этого медиа-хранилища? Если это 100 ГБ, которые никогда не будут расти, то вариант с объектным хранилищем нецелесообразен. Но совершенно другое дело, если объем от 1 ТБ, и он увеличивается на столько же ежегодно. Это однозначно клиент объектного хранилища, причем, на базе Ceph. Потому что это действительно удобная, рабочая, легконастраиваемая и открытая технология.

Третье. Насколько эти данные критичны для вашего бизнеса? Если есть вероятность потери бизнеса в случае потери данных, то объектные хранилища, не имеющие единой точки отказа, — очень хорошее решение.

CNews: Как история с переходом на объектное хранение сочетается с кризисом и с программой импортозамещения?

Александр Ланин: Кризис — в головах. С точки зрения ИТ, в любом кризисе можно найти решение. Да, сейчас стоит вопрос импортозамещения, и он как раз добавляет актуальности решениям на базе Ceph. Особенно для организаций из государственного сегмента тех, что попали под санкции, ведь Ceph — это не на 100% зарубежное решение. Открытое ПО, которые ты берешь и настраиваешь под заказчика.

Если же у клиента нет проблем с импортозамещением, финансовыми потоками, если он не ощущает кризисных явлений, то можно использовать enterprise-решение от крупного вендора. То есть, ответ на вопрос о кризисе зависит от конкретной организации. В любом случае, важно понимать, что каждому решению — свой заказчик. И у всех решений есть свои отрицательные и положительные стороны. Но каждый заказчик сам решает, насколько отрицательная сторона для него отрицательная, а позитивная — позитивная.

Но в чем мы в RedSys абсолютно уверены, так это в том, что объектное хранение данных позволяет бизнесу решить ключевые проблемы: нехватку скорости, медленную аналитику, невысокую надежность и низкую производительность. А все это в конечном счете упирается в финансовые потери. Объектные хранилища на базе Ceph, по нашему убеждению, не просто устраняют эти проблемы, но и приводят к серьезной экономии.

Видео