Подробнее про A-SIS

Немного подробностей о вышеупомянутой новинке: технологии де-дупликации - A-SIS (Advanced Single Instance Storage).

Технология базируется на существующей у файловой системы WAFL, использующейся внутри системы хранения, функции вычисления 16-разрядного “хэша”, уникальной контрольной суммы для каждого записываемого 4kb-блока. Занесенный в специальную внутреннюю базу данных, такой хэш позволяет для каждого записываемого блока проверить, не существует ли такой точно блок уже записанным на диск. Логично было бы, в случае если абсолютно точно такой блок данных уже присутствует на диске (а хэш-функция позволяет устанавливать идентичность блоков данных с абсолютной точностью), не занимать место на диске под еще одну копию данных, а хранить в каждом новом экземпляре блока данных только ссылку на единственную его копию.

Такой очевидный трюк “виртуализации” хранения данных к сожалению до сих пор не был реализован в “живой природе” по причине слишком высокой нагрузки на систему хранения при всех сопутствующих данному действию операциях (вычисление хэша, сохранение в базе данных, выборка по базе, создание линка и т.д.). Тем не менее те или иные реализации де-дупликации данных начали появляться, правда их реализации страдали многими “детскими болезнями”. Одной из первых такую технологию предложила год назад компания Network Appliance, правда, она была весьма ограничена в применении, поскольку использовалась только на “файловом” уровне, то есть определяла дубликаты файлов на NAS-системе, и работала только для задач резервного хранения, совместно с непростой и дорогой системой резервного копирования NetBackup технологического партнера NetApp компании Symantec (ранее Veritas).

И вот теперь, наконец, представлена полноценная система де-дупликации, работающая не только для файлов и для резервного копирования, но и для вообще любого, в том числе для “блочного” типа доступа, то есть работающего не только для NAS, но и для SAN! Не только для резервного копирования, где, без сомнения, де-дупликация сама по себе была черезвычайно полезна, даже несмотря на необходимость использования “тяжелого” и дорогого NetBackup, но и для любых используемых данных вообще!
Утверждается, что эффективность применения де-дупликации A-SIS может составлять от 20:1 до 50:1 “компрессии” хранимой емкости!

Еще более привлекательной эту технологию делает запланированная цена лицензии (как и все прочие функции системы хранения NetApp она уже существует в коде системы, и лишь включается введением соответствующей лицензии):
для Nearstore - бесплатно (!), для FAS - 3000$.

Где же нас Как насчет performance impact, влияния новой опции на производительность? Сам NetApp называет ее “незначительной” (1-3%), однако ждем более независимых и более “численных” результатов.
Так или иначе, никакого другого эпитета для этой технологии, чем весьма девальвированное в последнее время слово “революционный”, мне по этому поводу на язык не приходит.

См. также сообщения в компьютерной прессе:

C-News
E-Week
TechTarget

Оставить комментарий

20/0.131

Данный блог не спонсируется, не аффилирован, и не санкционирован компанией NetApp, Inc. Излагаемая в этом блоге точка зрения выражает мнение исключительно его автора и может не совпадать с позицией NetApp, Inc.

This content is not endorsed, sponsored or affiliated with NetApp, Inc. The views expressed in this blog are solely those of the author and do not represent the views of NetApp, Inc.