Облачное хранилище, как и другие облачные сервисы, предлагаемые поставщиком, доступно удаленно и предоставляет несколько возможностей, которые выполняются на оборудовании поставщика. Каждая из этих возможностей удовлетворяет разные потребности, но все они обеспечивают гибкость, чтобы Вы могли платить только за то, что используете. Ответственность за обслуживание базового оборудования и обеспечение доступности, устойчивости и защиты данных несет поставщик.
Наиболее распространенные типы облачного хранилища — объектные, блочные и файловые.
Типы хранилищ различаются в первую очередь способом доступа и производительностью. Требования к хранилищу, часто согласованные с конкретными потребностями, определяются приложением, использующим это хранилище, и его местоположением.
Большинство традиционных приложений, которые запускаются на физическом сервере и используют физические диски в Вашем центре обработки данных, используют файловое хранилище. Операционные системы, такие как Linux или Windows Server, представляют приложения, которые работают на них, с файловой системой, единым согласованным набором правил и методами хранения и извлечения данных. Операционная система незаметно обрабатывает дополнительную информацию. Является ли данный физический носитель твердотельным диском (SSD)? Или традиционным вращающимся жестким диском? Оптическим диском? Или удаленным сетевым общим файловым ресурсом? У приложений этих потребностей нет, поскольку они изначально открывают, читают, записывают и сохраняют файлы в соответствии с запрограммированными правилами, а не точными физическими деталями, которые могут отличаться.
Облачное файловое хранилище представляет собой операционные системы, работающие на серверах в облаке, со стандартным сетевым файловым ресурсом аналогично сетевым файловым ресурсам, которые могут работать в Вашем собственном центре обработки данных и которые операционная система представляет приложениям в виде файловой системы. Затем этот файл может соответствующим образом использоваться приложениями, работающими на вычислительных экземплярах в облаке. Приложения не нужно модифицировать или изменять для работы с другим хранилищем при работе в облаке, они продолжают работать с файловым хранилищем, которое использовали всегда.
Провайдер облачных решений управляет оборудованием, включая физические диски и сеть, и обеспечивает репликацию и защиту данных, в то время как планирование емкости автоматически адаптирует ресурсы с увеличением потребности. По сравнению с традиционным подходом, когда необходимо тщательно планировать закупки сетевых файловых систем, чтобы удовлетворить потребности будущего роста, а затем управлять оборудованием и обеспечивать защиту этих данных самостоятельно, соответствующие преимущества облачных систем очевидны.
Виртуальные диски похожи на облачное файловое хранилище, поскольку они представляют собой расширенную версию сетевого хранилища, которое Вы, возможно, уже используете в своем центре обработки данных. Виртуальные диски представляют собой иную абстракцию по сравнению с дисками операционной системы, которым свойственны меньшие сетевые издержки и более высокая производительность, но которые требуют дополнительных настроек и управления на уровне операционных систем.
Их можно настроить с различными параметрами для повышения производительности или снижения затрат. В отличие от облачного файлового хранилища, виртуальные диски блочного хранилища должны иметь определенный размер, но этот размер можно увеличить в любое время, пока диск остается в сети и доступен использующим его приложениям.
Как и с любым другим облачным сервисом, провайдер управляет оборудованием, планированием емкости и гарантирует репликацию и защиту данных.
Доступ к объектному хранилищу осуществляется иначе, чем к другим типам хранилищ, рассмотренным выше. Так как доступ к программным приложениям осуществляется напрямую, а не через операционную систему, приложение должно быть специально написано для использования объектного хранилища. Объектное хранилище поддерживается удаленно из приложения, и доступ к нему выполняется по двум похожим сценариям, в которых, однако, есть существенные различия. Во-первых, к нему часто обращаются через интернет-приложения, работающие на отдельных компьютерах, мобильных устройствах, устройствах Интернета вещей и т. д. Во-вторых, оно может использоваться приложениями, выполняющимися в облаке.
Приложения, использующие объектное хранилище, могут динамично хранить и извлекать неструктурированные данные удаленно, без использования файловой системы, поскольку хранимые элементы — это просто абстрактные объекты, предоставляемые облачным провайдером. Это означает, что разработчик приложения обеспечивает максимальную гибкость и по существу получает неограниченное хранилище данных в свободной форме в облаке, при этом оплата начисляется только за сохраненный и переданный объем.
У объектного хранилища есть два недостатка: немного больше работы для разработчиков приложений по управлению их собственными форматами объектов и ограничения производительности. Доступ к объектному хранилищу осуществляется программным обеспечением, выполняющим API-вызовы, обычно через Интернет, поэтому то, что может занять микросекунды у диска, подключенного напрямую, и миллисекунды у блочного или файлового хранилища, у объектного хранилища иногда может занимать секунду и даже больше. Во многих сценариях использования (например, когда конечные пользователи запускают приложения на своем телефоне, подключенном к облачному хранилищу) эта производительность является приемлемой, особенно благодаря возможности “доступа из любого места”, которую предоставляют эти приложения. Конечно, если приложение, использующее объектное хранилище, работает в облаке, где хранятся объекты, производительность значительно выше, поскольку все ресурсы находятся в одном регионе в собственной сети облачного провайдера.
Высокопроизводительные вычисления (HPC) становятся все более распространенными, поскольку приложения ИИ, машинного обучения, инженерного и финансового моделирования используются все большим количеством компаний. Достижения последних лет позволили сделать высокопроизводительные вычисления в облаке возможными, легко доступными и приемлемыми по стоимости.
Однако, согласно недавно опубликованным данным в блоге Oracle Cloud Infrastructure, пропускная способность совместно используемой файловой системы для вычислительных кластеров часто является препятствием для симулирования, искусственного интеллекта и машинного обучения, а также сложного моделирования.
“Мы можем обеспечить такой уровень производительности, потому что наше блочное хранилище поддерживается носителями NVMe SSD, а наши центры обработки данных имеют быструю плоскую сетевую архитектуру. Мы настолько уверены в возможностях нашего предложения по хранению данных, что предлагаем уникальное соглашение об уровне обслуживания (SLA), которое гарантирует производительность нашего блочного хранилища. Пропускная способность зависит от размера диска, и все диски размером 1 Тбайт и больше обеспечивают скорость до 480 МБ/с по умолчанию на сбалансированном уровне производительности без дополнительной оплаты.”
В хранилище такого типа кластеры файловых серверов с экземплярами облачных компьютеров должны создаваться вручную с твердотельными накопителями с прямым подключением, при этом обеспечивается высочайший уровень производительности,— высочайшая пропускная способность и наименьшие задержки,— что и требуется для этих приложений HPC.
По мере того как ИТ-рынок и экосистема меняются, эти изменения в значительной степени предвещают и отчасти отражают значительную перестройку ландшафта хранилищ. В условиях непрерывного роста объемов данных и затрат на их хранение и защиту специалисты в области хранения данных предполагают, что в будущем среды хранения и центры обработки данных будут кардинально отличаться от сегодняшних. Для менеджеров корпоративных систем хранения данных пытаться идти в ногу с ростом объемов данных, одновременно совмещая потребности в безопасности данных и требования к архивированию и сдерживанию затрат, — это все равно что плыть вверх по течению и еще тащить за собой груду невиртуализированных массивов хранения.
Масштабируемость облака и эластичная модель с оплатой по мере роста означают, что не нужно тратить деньги на обновление хранилища независимо от его размера и степени детализации, будь то запланированная или краткосрочная детальная задача. Кроме того, использование облачных сервисов почти всегда считается операционными расходами и часто является отдельной позицией ежемесячного бюджета. Оба эти аспекта всегда облегчают создание и контроль расходов.
Вот некоторые из многочисленных сценариев использования облачных решений хранения для объектного хранилища, хранилища файлов и виртуальных дисков.