Согласно исследованиям международного рынка гипермасштабируемых дата-центров, ежегодные темпы роста информации составляют около 10-11%. Основные потребители:
- крупные предприятия;
- подключаемые устройства умного дома;
- пользователи;
- социальные сети и мессенджеры.
Они генерируют гигантское количество трафика, что вынуждает производителей СХД регулярно ломать голову над объемом, надежностью и доступностью складируемых интеллектуальных запасов.
Способы хранения данных
Индустрия знает о трех ключевых технологиях хранения информации:
- блочная — объекты делят на блоки одного размера (chunks), при этом информацию можно разбрасывать по разным массивам;
- объектная — каждому файлу присваиваются информационные метаданные (видео, документ, изображение, таблица), по которым объект легко выудить из общей массы;
- файловая — наиболее привычная пользователю система, как на домашних ПК: папки, файлы и т.д. Таким образом достигается наилучшая иерархия.
И поскольку этот вариант наиболее близок для восприятия — рассмотрим его более пристально.
Файловый принцип хранения данных
Файловая система хранения, поиска и обработки информации хороша тем, что каждый объект можно отправить в свою папку, чтобы разделить данные по классам. С одной стороны, это очень удобно и наглядно. Но что делать, когда информация исчисляется петабайтами? Один путь может занимать сотни, если не тысячи подпапок, что ставит крест на скоростном доступе к нужному файлу.
Создатели технологии это прекрасно понимают, а потому идут другим путем. Доступ ко всем данным идет через file ID, в котором содержатся:
- имя сервера (server name);
- полный путь к папке (directory path);
- имя файла (filename).
При этом все это крутится внутри сети общего пользования, будь то сервер, или NAS. Если что, мы говорим не о классических NAS-хранилищах для дома и малого бизнеса, где хранятся фотографии и фильмы. В данном случае речь идет о масштабируемых коммерческих системах, работающих на базе Windows Server for Storage:
- развернутая и гибкая система управления;
- масса ступеней конфиденциальности и уровней доступа;
- поддержка сжатия данных;
- технологии дедупликации и все в таком духе.
Мы уверены, что среди читающих наверняка остались скептики, которые все еще считают файловую систему примитивной на фоне блочной и объектной. Поэтому рекомендуем обратить пристальное внимание на HPE StoreEasy 1000 даже в базовом исполнении — приятно удивитесь.
Плюсы и минусы файловых систем
У любой технологии есть как достоинства, так и недостатки. Разберем подробно те, что относятся к файловому хранению.
Достоинства подхода
Ключевое преимущество технологии — простота. Сервер присваивает файлу имя и метаданные, после чего этот фрагмент из единиц и нулей под чутким руководством управляющего ПО идет искать себе место в папках и подпапках.
Второе важное преимущество — стоимость развертывания системы. Файловые NAS обойдутся дешевле блочных, что критически важно для небольших компаний. К тому же, привычная иерархическая топология не требует переучиваться начинающих системных администраторов, если вы имеете дело с относительно небольшим объемом данных.
Нередко файловые системы и локальные архивы объединяют внутри одной машины, что также щадит бюджет.
Недостатки
Как мы уже сказали, файловые СХД хороши до тех пор, пока данных не становится чрезвычайно много. Масштабировать такие системы не представляется возможным. В теории — легко, но скорость поиска начинает стремиться к нулю.
Если вы ориентируетесь на дата-центры и ЦОД с широкой полосой пропускания, лучше не зацикливаться на файловых системах, поскольку в итоге только проиграете.
Протоколы доступа
Для файловых СХД характерно использовать два протокола:
- NFS — Network File System;
- CIFS — Common Internet File System.
Первый — представлен для ОС на базе Linux/Unix, второй — ориентирован под системы на Windows Server. CIFS, как ни странно, открытый протокол, сформированный на базе SMB. И тот, и другой берут за основу TCP/IP.
Сам же сервер внутри себя использует блочный принцип организации хранения, что увеличивает плотность данных, а пользователь попадает к закромам информации по вышеуказанным протоколам. Последние и определяют местоположение файла, включая его атрибуты (размер, тип).
Организация файлового хранения
Давайте подробно поговорим, по какому принципу на дисках лежат данные. Не удивляйтесь, но все рассортировано по папкам. Каждая директория располагает всей необходимой информацией и атрибутикой. Большая часть ресурсов управляется ФС (файловой системой).
Папка — один из вариантов служебного файла, к которому пользователь может получить доступ через административные ресурсы. Внутри директории упакованы следующие данные:
- тип и название файла;
- полный адрес;
- текущая/предельная длина файла;
- дата/время доступа/изменения;
- User/Owner ID (он же - идентификатор);
- данные о защите.
В самой же папке можно производить ряд утилитарных и сервисных операций:
- создание/удаление;
- поиск и раздача тегов;
- формирование списка;
- переименование;
- перенос информации в другую ФС.
Если это для вас слишком просто, переходим к более сложным этапам организации хранения.
Уровни директорий
Файловая система хранения может быть трех типов:
- одноуровневая;
- двухуровневая;
- древовидная.
Первая — самая простая, поскольку хранящиеся на сервере файлы и папки доступны всем пользователям, у которых есть соответствующий уровень доступа.
В этом случае уже можно создавать файлы с идентичными именами. К тому же, поиск файлов более эффективен. Третья — самая сложная с точки зрения первичной настройки, но удобная в плане эксплуатации.
Алгоритм поиска задается администратором под конкретную организацию. Принцип основан на библиотечном хранении.
Какие задачи решает файловая система
Организация файловых СХД отлично себя показывает внутри локальной сети предприятия по LAN или WAN. На плечи таких систем ложатся следующие действия:
- электронный документооборот;
- резервное копирование, виртуализация, создание локальных профилей;
- хранение медиатеки;
- хранение данных видеонаблюдения;
- ведение картографии.
Как видите, все задачи носят некритический характер и рассчитаны скорее на малый бизнес, где длительное время отклика сервера не вызывает дерганье глаза. Для компьютерного зрения, нейросетей и бизнес-аналитики мы бы рекомендовали более прогрессивные варианты.
Подведем итог
Файловая СХД в случае малого и среднего бизнеса представляет собой отличное решение по соотношению «цена/производительность». Такие устройства довольно просто развернуть без узкоспециализированной инфраструктуры, легко внедрить в централизованную систему NAS для увеличения безопасности хранения данных.
Благодаря современному ПО в области информационной безопасности вы сможете тонко настроить уровни доступа для каждого сотрудника, вплоть до возможности игнорировать файлы определенного расширения, помечая их как потенциально вредоносные.
Но самое главное — автоматизация хранения с централизованным мониторингом трафика.
У вас остались вопросы в отношении СХД? Задавайте их специалистам компании Маркет.Марвел. Наши специалисты предоставят вам исчерпывающую предметную консультацию по помощи с выбором, настройкой, внедрением и эксплуатацией любого серверного оборудования, представленного на сайте.