По данным Gartner, в 2024 году треть опрошенных подтвердили повышение эффективности работы благодаря ИИ, а 20%, напротив, отметили снижение производительности. Несмотря на такую статистику, искусственный интеллект продолжает быть в центре внимания бизнес-лидеров и инвесторов.
Хайп питает идеи стартапов. Уж больно нравится всем ИИ: больше нет областей, где нельзя придумать для него какое-нибудь применение. А нейросети в организации — это кратное увеличение объёмов данных, которые нужно хранить. И не просто хранить, но содержать в порядке, чтобы принимать на их основе более эффективные управленческие решения.
Дата-лидерам, кроме поддержания данных в высокой степени готовности, также необходимо заботиться об их целостности и сохранности. Это большая и важная область — об этом как-нибудь расскажу в отдельной статье.
Что же делать дата-лидерам? Какие инструменты помогают им в 2025 году? Рассмотрим актуальные тренды сезона лето/осень-2025.
Тренд 1: платформы хранения данных,
оптимизированные под ИИ-приложения
Все сильно заморочились по поводу ИИ. CIO повсеместно подтверждают этот приоритет, не скрывая радости от роста ИТ-бюджетов. Когда ещё такое будет, чтобы бизнесу не жалко было денег? В 2025 году Gartner прогнозирует рост ИТ-бюджетов почти на 10%.
Обучать модели компании стараются на своей или хотя бы на контролируемой территории. Локально хранящиеся данные нужны как для более тонкого обучения системы, так и для помощи большой языковой модели с ответом на ваш запрос при так называемом RAG (retrieval augmented generation) — вспомогательной генерации ответа. Этот метод используется, чтобы сузить контекст при генерации ответа языковой моделью. Это делает выдачу более точной, но требует хранения информации "дома", под рукой.
Как всегда бывает, есть спрос — будет предложение. Производители оборудования мгновенно изготовили для бизнеса платформы, которые могут хранить как обычную информацию, так и подготовленную для ИИ-приложений. Вендоры увеличили производительность, чтобы платформы справлялись с нагрузками при подготовке данных для GenAI. А это, как вы понимаете, не мало!
Плюс добавили агрегацию, категоризацию и оркестрацию данных для повышения качества их обработки. Производительность достигается за счёт более продвинутой технологии транспорта данных NVIDIA DirectAPI, NFS по RDMA и других инструментов, которые могут работать как в объектном хранилище, так и в файловой системе.
Прогноз Gartner: к 2028 году более 20% предприятий будут запускать ИИ-нагрузки (обучение и умозаключения) локально на своих ресурсах. Для сравнения: в начале 2025 года таковых было 2%.
Разворачивать ИИ-модели при этом удобно в облаке: часть провайдеров уже предоставляет развитые инструменты для создания и обучения нейросетей. Например, AI Studio от Yandex Cloud для запуска многофункциональных ИИ-приложений. Решение объединяет генеративные нейросети для текстовых и визуальных генераций, технологии синтеза и распознавания речи, среду для обучения и другие ML-фичи — неплохая помощь любому проекту.
Такие платформы позволяют не создавать отдельное озеро данных для ИИ, так как используется то же хранилище, что для других данных. Соответственно, это экономия для компании. Кроме того, данные в отдельном озере устаревают быстрее по сравнению с теми, что используются постоянно, а обучать ИИ лучше на актуальных данных.
Тренд 2: появление решений SSD в Nearline
Сейчас объясню, ничего сложного. Любая программа работает с данными в двух режимах: онлайн и офлайн. Онлайн — это когда данные нужны для работы самой программы. В этом случае используются устройства типа флешек — SSD, твердотельные накопители.
Офлайн — когда данные нужны по запросу, а не для работы программы. Например, система по работе с клиентами может обращаться за адресами электронной почты или номерами телефонов при рассылке во время рекламной кампании. Такие данные не нужны в режиме онлайн, поэтому они хранятся по-другому — на дисках. Так раньше записывали музыку на виниловые пластинки. Данные с дисков выдаются по запросу при необходимости. Это HDD — жесткий диск.
Представьте себе, какая разница между онлайн и офлайн-режимом. Первый скорее быстрый, чем надёжный, второй — наоборот: он был создан, чтобы лежать, а не бегать. При этом первый существует, только когда есть питание. Второй же хранит данные и без сети питания (пластинки). Ну и, кроме всего прочего, на жестком диске можно разместить намного больше информации, чем на флешке.
Русское слово "память" содержит два понятия, которые в английском языке выражаются разными словами: memory — краткосрочная, оперативная память для работы программ и storage — долгосрочное хранение данных в режиме офлайн, как в библиотеке.
Nearline — это нечто среднее между онлайном и офлайном. Этот подход сочетает в себе достоинства двух миров и, смею надеяться, не имеет их недостатков. Информацию, которую обычно хранят на жестком диске, размещают в режиме высокой готовности. В этом году тренд заключается в том, что теперь эти данные можно размещать на флешках — устройствах памяти SSD, а не в архиве — на дисках.
Как это возможно? Сравнительно небольшая емкость флешек не позволяла этого делать раньше, но в 2025 году производители предлагают устройства с уплотненными ячейками. Был у вас кошелек с тремя отделениями — а теперь с четырьмя. Ячейки triple-level cell (TLC) стали quad (-ruple) level cell (QLC). Есть разница? В корпоративном хранении это позволяет разместить больше информации при меньших расходах. Просто праздник какой-то!
Кроме того, некоторые поставщики выпускают программируемые флешки (FPGA, field-programmable gate array), что не только повышает пропускную способность и производительность устройств, но и делает их умными! Теперь флешки могут совершать вещи, на которые были неспособны раньше: сжимать, шифровать, защищать и удалять данные.
Это, конечно, меняет все. Некоторые айтишники предлагают вовсе отказаться от "винила" и перейти на флешки полностью. QLC — это как раз недорогой способ попробовать. Поставщики предлагают гарантии качества, чтобы снизить переживания по поводу сохранности данных на новых носителях.
Так что приятного аппетита — налетайте! Gartner считает, что к 2028 году 65% корпоративных мощностей хранения будет на QLC NVMe SSD (в 2024 году было 28%).
Облачные провайдеры тоже активно внедряют новинку. Это позволяет им снижать затраты, так как они могут разместить больше на гораздо меньшем дисковом пространстве. Затраты на электроэнергию также снижаются: нет дисков, чтобы разгонять, нет необходимости затрачивать на это электричество.
Для удобства собрал все в табличку:
Параметр сравнения | TLC SSD | QLC SSD | Nearline HDD |
Стоимость в 2025 году | Высокая | Средняя | Низкая |
Производительность | Высокая | Средняя | Низкая |
Надежность | Высокая (<0,3% отказов) | Средняя (<0,5% отказов) | Средняя (<5% отказов) |
Питание (Вт/ТБ) при совокупной стоимости владения | Высокое | Низкое | Высокое |
Максимальная емкость | 4–32 ТБ | 64–150 ТБ | 22–34 ТБ |
Нагрузки | Производительность: базы данных, виртуализированные среды, ИИ/машинное обучение, аналитика, высокопроизводительные вычисления | Мощность/затраты: стандартные и чтение-интенсивные нагрузки, резервирование/ аварийное восстановление, озера данных для ИИ/машинное обучение, доставка контента | Нечастые запросы: холодное хранение, резервирование/восстановление, озера данных, наблюдение |
Тренд 3: активная защита и киберхранилища
Не иссякают творческие идеи и у злоумышленников. Раньше у корпоративных защитников средства в арсенале в основном были сосредоточены на сетевом или прикладном уровне и сводились к преодолению последствий атаки и обеспечению непрерывности бизнеса. Более активные формы защиты обсуждались, но силы добра не могли использовать тёмную сторону, так что в колчане вместо стрел были только традиционные — мирные — средства обеспечения безопасности. Как у лондонских полицейских, которых не обеспечивают огнестрельным оружием.
Но в новом сезоне-2025 все меняется. Джедаи начали применять тёмную сторону силы, потому что информация стала слишком ценным активом.
Другим привлекающим кибервзломщиков свойством является потенциальный ущерб, который грозит жертвам в случае утечки данных. Тут не только репутационный риск, но и финансовый — в случае обращения пострадавших в суд. Финансовые последствия могут быть серьёзными, включая штрафы за несоблюдение законов о защите данных, судебные издержки из-за разбирательств, ну и в худшем случае — выплату выкупа киберпреступникам.
Кроме того, сбои в работе, связанные с простоем систем, могут привести к остановке деловой активности, что вызовет дальнейшее финансовое напряжение и потерю доверия клиентов. Долгосрочный репутационный ущерб также может подорвать лояльность клиентов и рыночные позиции.
Чтобы этот сценарий не материализовался, специалисты по хранению данных приготовили решение под названием cyberstorage. Это хранилище, вооруженное средствами кибербезопасности. Настоящие стражи галактики данных! Они могут активно предотвращать угрозы, защищать и восстанавливать данные. Cyberstorage также поддерживает аналитику данных, криминалистический анализ атак и интеллектуальные возможности восстановления для конкретных систем хранения.
Как это работает? К примеру, в арсенале предлагается услуга неизменяемого хранения, при котором файлы делают недоступными для редактирования, замены и удаления. Это позволяет быстро восстановить данные при их потере в основном месте хранения.
Кроме того, такие хранилища предлагают расширенные возможности обнаружения потенциальных кибератак для упреждающего смягчения их последствий. Помимо безопасности, эти решения способствуют поддержанию доступности данных и непрерывности бизнеса, обеспечивая более быстрое и чистое восстановление. Они не только защищают систему от несанкционированного доступа, но и обнаруживают случаи компрометации и угрозы в режиме реального времени на уровне блоков на основе энтропии (анализируются паттерны энтропии, отличные от нормы), поддерживают обнаружение на основе файловой активности и так далее. Подробно напишу об этом в другой раз.
"Как все здорово, заверните пожалуйста", — так и хочется сказать. Но, как всегда, есть нюансы. На что обратить внимание? Организации могут столкнуться с трудностями интеграции киберрешений с существующими системами хранения данных, либо может потребоваться модернизация устаревшей инфраструктуры до более продвинутых уровней. Этот переход часто требует специализированных знаний для беспроблемного внедрения и управления сложностями новых протоколов безопасности.
Несмотря на эти проблемы, внедрение решений для киберхранения данных открывает значительные возможности. Cyberstorage может предоставляться и как услуга корпоративной платформы хранения данных, и как специализированный продукт с полным набором функций. Как правило, киберхранилище дополняет, а не заменяет традиционные меры безопасности.
Тренд 4: интегрированный интеллектуальный анализ данных
Интегрированный интеллектуальный анализ данных — это ещё одна новая способность современных платформ хранения. Зачем она нужна? Дело в том, что объём неструктурированных данных, которые организации накапливают при работе, динамично растёт. А получение аналитических сведений из них — та самая искомая бизнес-ценность данных — задача нетривиальная. Ребятам из отдела аналитики приходится для этого попотеть.
Новое свойство систем позволяет, аналогично SQL, выполнять запросы к неструктурированным данным путём предварительной обработки и — внимание! — хранения данных в полуструктурированном формате. При этом система анализирует объекты прямо в момент приёма — для обогащения их метаданных и определения соответствующих подсегментов. Именно это обеспечивает высокоскоростное извлечение выбранных объектов или фрагментов объекта.
Обработку данных для извлечения выбранного сегмента также можно выполнять во время извлечения или учета данных. Эта возможность превращает системы хранения данных из пассивных хранилищ в интеллектуальные системы управления данными. Это может снизить зависимость от внешнего приложения, такого как хранилище данных, что способствует общему снижению затрат и более быстрому анализу данных.
Тренд 5: гибридное хранение
Начну с прогноза Gartner: у половины айтишников к 2028 году будет хотя бы одно гибридное облачное решение для хранения данных (для сравнения: в этом году таковых 15%).
Гибридное хранение позволяет компаниям распределять рабочие нагрузки между локальными и облачными хранилищами, предлагая расширенные возможности для удовлетворения текущих потребностей, обеспечивая при этом адаптацию к будущим изменениям в бизнес-операциях, поддержку новых рабочих нагрузок и упрощение интеграции облачных решений и миграции в облако.
Гибридные хранилища и сервисы данных обеспечивают бесперебойную работу систем хранения и обработки данных в различных сценариях развёртывания: основной центр обработки данных, колокация, граничные вычисления и общедоступное облако.
Сегодня на рынке есть такие решения, как гибридные облачные платформы, корпоративные платформы, гиперконвергентные решения, массивы хранения данных, программно-определяемые хранилища (SDS), распределенная гибридная инфраструктура и программное обеспечение для управления данными.
При выборе провайдера стоит смотреть в сторону крупных игроков, которые локализовали хранение данных в контуре страны, предлагают широкий спектр решений, гарантируют оперативную поддержку и обеспечивают отказоустойчивость даже при высоких нагрузках.
Модель гибридного облачного хранилища изначально была ориентирована на аварийное восстановление и непрерывность бизнеса, но быстро расширилась и охватила большой набор сценариев использования для обеспечения рабочих процессов приложений, которые охватывают несколько местоположений. Растущее внедрение таких технологий, как искусственный интеллект, GenAI и аналитика больших данных, в сочетании с ростом периферийных вычислений привело к увеличению спроса на гибридную облачную инфраструктуру и решения для доставки данных. Кроме того, расширяющееся число поставщиков, предлагающих глобальное пространство имен и другие инновации, упростило компаниям реализацию гибридного облачного хранения.
Завершая чтение моей статьи, подумайте, что вы сделаете по-другому, когда вернетесь мыслями к своему предприятию или встретите у кулера вашего героя-айтишника. Теперь вы знаете, что в 2025 году можно быстро применить с пользой.
А выбирая провайдера, задайте ему вопросы про дополнительные сервисы, о которых я рассказал в этой статье: оптимизировано ли их хранилище для работы ИИ-приложений, позволяет ли дизайн быстро извлекать данные, есть ли услуга cyberstorage, умное ли хранилище — может ли оно из вашего фарша данных изготовить котлеты-полуфабрикаты?
С командой управленцев определите, какие компоненты бизнес-стратегии требуют изменения в железе. Проработайте с айтишниками разные сценарии и выберите свой короткий путь, который максимально выгоден именно вам и именно сейчас.
Саян Доржиев,
MBA, ex-Gartner, эксперт по управлению корпоративными технологиями