RAID-массив: доступное быстродействие. Особенности эксплуатации RAID-массивов

Скачать Viber 28.03.2019
Скачать Viber

Часто задаваемые вопросы (FAQ)

Тактика выбора сервера.

Отказоустойчивый сервер.

Что такое RAID?

Уровни RAID

Сервер - есть решение задачи. Суть понятия.

Се́рвер (англ. server от англ. to serve — служить) — в информационных технологияхпрограммный компонент вычислительной системы, выполняющий сервисные функции по запросу клиента , предоставляя ему доступ к определённым ресурсам

Итак, основная задача сервера - исполнять запросы клиентов либо программ. Отсюда следует, что сервер - вещь сугубо утилитарная, предназначенная для выполнения определенной задачи. Выполнение, или решение задачи - является главным свойством сервера. Вот почему - сначала ставиться задача , а затем под неё подбирается сервер .

Сбалансированный сервер. Как найти оптимальный баланс?

Сбалансированный сервер - это та цель, которую преследует интегратор или продавец и заказчик. Заказчику в первую очередь нужно получить сервер, отвечающий его требованиям, которые в свою очередь определяет задача , которую он будет решать. В наших интересах предоставить заказчику сервер максимально соответствующий его требованиям. Такое сотрудничество взаимовыгодно. Клиент получает сервер именно тот, который нужен ему. Не переплачивая за лишнее, и не выбрасывая денег за то, что работать не будет. Мы получаем довольного клиента и репутацию.

Задача же подбора этого оптимального сервера является нетривиальной. Необходимо учитывать множество факторов, о которых заказчик даже не подозревает. Типичный пример - неадекватная оценка заказчиком масштаба задачи или требование сервера по конкретной спецификации, вместо того, чтобы рассказать задачу, которую будет решать сервер. Специалисты STSS ежедневно сталкиваются с самыми различными задачами, и у компании уже накоплен серьезный опыт в построении серверов - вот почему подбор конфигурации сервера - задача профессионала, равно как и ее реализация, т.е. непосредственно само производство.

Тактика выбора сервера.

Тактика выбора сервера заключается в первую очередь в выяснении задач, которые должен будет решать сервер, какой необходим запас производительности, и возможности масштабирования. Далее выясняются требования к отказоустойчивости и наконец ориентировочный бюджет. Если задачи явно превосходят выделенный бюджет, то по возможности производиться корректировка бюджета либо задачи. Важным является предложение масштабируемого решения для растущих потребностей клиента. Это позволяет решать задачу с минимальными как начальными так и последующими вложениями, снижая TCO (Total Cost of Ownership - совокупная стоимость владения).

Придерживаясь вышеизложенной тактики, в сочетании с профессионализмом наших инженеров и менеджеров, клиент получает именно то решение, которое ему необходимо.

Отказоустойчивый сервер.

Как правило сервер обслуживает множество пользователей. Поэтому, сервер в идеале всегда должен быть в рабочем состоянии, чтобы исполнить тот или иной запрос. Если Ваш домашний компьютер перестанет работать, то в конечном итоге от этого пострадаете только Вы. Если же сервер перестанет работать, то пострадают множество клиентов, что может обернуться несоизмеримыми потерями по сравнению со стоимостью самого сервера.

Часто путают понятия «надежность» и «отказоустойчивость».

Надежность - это в первую очередь свойство изделия, характеризующее его способность работать максимально долго без сбоев. Т.е. это скорее характеристика качества самого изделия, его компонентов и т.д.

Отказоустойчивость - это, следуя из самого образования слова - способность противостоять отказам. Иными словами, это способность сохранять работоспособность при отказе каких-либо компонентов системы. В настоящее время отказоустойчивость достигается благодаря избыточности или дублированию критичных или наиболее уязвимых компонентов системы.

Время простоя сервера. Способы сокращения.

Способами повышения отказоустойчивости сервера и как следствие снижения времени простоя является применение таких элементов как: RAID-массивы (дублирование жестких дисков), дублированные блоки питания, дублированная система охлаждения, в ряде случаев - дублирование подсистемы памяти (т.н. зеркалирование модулей памяти).

Если необходимо еще больше повысить отказоустойчивость системы, то говорят уже о построении HA-кластеров (High Availability Clusters - кластеры высокой доступности или готовности). HA-кластер - представляет из себя полностью дублированную систему серверов, систем хранения, коммутации и питания. Такая система имеет один из самых высоких показателей готовности, которое измеряется временем простоя в год, либо отношением времени работы к времени простоя выраженное в процентах. Кроме того, такая система позволяет не останавливать систему для проведения ремонтных и регламентных работ, что также существенно повышает готовность в целом.

Для сравнения, показатели готовности различных вычислительных машин:

    обычный ПК - ~90% в год или 36,5 суток простоя в год.

    сервер начального уровня - ~96% в год или 14,6 суток простоя

    отказоустойчивый сервер - ~98% в год или 7,3 суток простоя

    кластер высокой готовности - 99,99% в год или 53 минуты в год

Я умею собирать компьютеры и считаю, что могу собрать сервер! Почему я должен покупать сервер у Вас?

Такой вопрос часто задается нашими клиентами, когда они пытаются рассчитать стоимость сервера из стоимости комплектующих. Действительно, стоимость комплектующих ниже стоимости сервера, иначе мы бы просто работали себе в убыток. Но давайте попробуем разобраться за что клиент «переплачивает».

Во-первых, задача технически собрать сервер не такая уж тривиальная, как может показаться сначала. Серверы имеют схожие элементы с обычными ПК, например - корпус, блок питания, материнская плата, процессоры, память, жесткие диски и т.п.

На первый взгляд - все просто. Купил нужные комплектующие, и собрал сервер! Вот здесь такого «сборщика» поджидают первые неприятные сюрпризы.

Например, серверная материнская плата работает только со специализированной серверной памятью. Да еще не со всякой, а с валидированной, т.е. явно прописанной производителем этой платы. Корпус тоже не всякий подойдет - здесь подводных камней еще больше! Формат серверной материнской платы как правило отличается от привычного ATX. Питание также специфическое. Дело в том, что сервер является активным потребителем тока по +12вольт. На этом напряжении работают преобразователи напряжения для процессоров (VRM - Voltage Regulator Module), а каждый процессор способен потреблять огромный ток! А теперь представьте, что их не один, а два! Каждый по 100Вт рассеиваемой (=потребляемой мощности). Итого 200Вт - только процессоры! Даже если предположить, что КПД VRM-ов близко к 100%, то получиться, что только процессоры потребляют ток 200/12=16,7Ампер по шине +12Вольт. Посмотрите на десктопные блоки питания - на них, как правило, указан показатель 13-15 ампер для шины +12 вольт, а кроме процессоров в сервере есть диски, сама материнская плата, память и т.д. Поэтому, сервер должен иметь специализированный серверный блок питания, который помимо надежности, способен выдавать нужный ток по +12вольт. Этот показатель для современных серверных БП составляет примерно от 30 до 80Ампер!

Этот наглядный и к сожалению далеко не единственный пример ярко иллюстрирует проблемы неквалифицированного подхода к сборке сервера.

Во-вторых, необходимо обеспечивать гарантийное обслуживание и техническую поддержку. Очевидно, что на высоком техническом уровне заказчик самостоятельно не в состоянии быстро разрешить какие-либо проблемы, что как следствие приводит к простою сервера и оборачивается убытками для компании несоизмеримо бОльшими, чем возможная экономия.

Компания STSS обладает преимуществами, которые позволят Вам получить наиболее подходящее решение (сервер) и высококвалифицированную техническую и гарантийную поддержку.

Собственное производство, многолетний опыт, непрерывные исследования являются залогом качества продукции и профессионализма сотрудников.

Что такое RAID?

Аббревиатура RAID изначально расшифровывалась как «Redundant Arrays of Inexpensive Disks» («избыточный (резервный) массив недорогих дисков», так как они были гораздо дешевле оперативной памяти). Именно так был представлен RAID своими исследователями: Петтерсоном (David A. Patterson ), Гибсоном (Garth A. Gibson ) и Катцом (Randy H. Katz ) в 1987 году. Со временем RAID стали расшифровывать как «Redundant Array of Independent Disks» («избыточный (резервный) массив независимых дисков»), потому как для массивов приходилось использовать и дорогое оборудование (под недорогими дисками подразумевались диски для ПЭВМ). RAID служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации.

Беркли представил следующие уровни RAID, которые были приняты как стандарт де-факто:

    Представлен как неотказоустойчивый дисковый массив.

    Определён как зеркальный дисковый массив.

    RAID 2 зарезервирован для массивов, которые применяют код Хемминга. В настоящее время не используется.

    RAID 3, 4, 5 используют чётность для защиты данных от одиночных неисправностей. В настроящее время используется в основном только RAID 5.

    RAID 6 используют чётность для защиты данных от двойных неисправностей

Уровни RAID

Схема RAID 0.

RAID 0 («Striping») — дисковый массив из двух или более HDD с отсутствием избыточности. Информация разбивается на блоки данных (Ai) и записывается на оба/несколько диска поочередно.

За счёт этого существенно повышается производительность (в зависимости от количества дисков зависит кратность увеличения производительности), но страдает надёжность всего массива. При выходе из строя любого из входящих в RAID 0 винчестеров полностью и безвозвратно пропадает вся информация. В соответствии с теорией вероятностей, надёжность массива RAID 0 равна произведению надёжностей составляющих его дисков, каждая из которых меньше единицы, т. о. совокупная надёжность заведомо ниже надёжности любого из дисков.

Схема RAID 1.

RAID 1 (Mirroring — «зеркало») имеет защиту от выхода из строя половины имеющихся аппаратных средств (в частном случае — одного из двух жёстких дисков), обеспечивает приемлемую скорость записи и выигрыш по скорости чтения за счёт распараллеливания запросов. Недостаток заключается в том, что приходится выплачивать стоимость двух жёстких дисков, получая полезный объем одного жёсткого диска.

Изначально предполагается, что жёсткий диск — вещь надёжная. Соответственно, вероятность выхода из строя сразу двух дисков равна (по формуле) произведению вероятностей, то есть ниже на порядки. К сожалению, данная теоретическая модель не достаточно полно отражает процессы, протекающие в реальной жизни. Так, обычно два винчестера берутся из одной партии и работают в одинаковых условиях, а при выходе из строя одного из дисков нагрузка на оставшийся увеличивается, поэтому на практике при выходе из строя одного из дисков следует срочно принимать меры — вновь восстанавливать избыточность. Для этого с любым уровнем RAID (кроме нулевого) рекомендуют использовать диски горячего резерва HotSpare. Достоинство такого подхода — поддержание постоянной надёжности. Недостаток — ещё большие издержки (то есть стоимость трёх винчестеров для хранения объёма одного диска).

Схема RAID 5.

Cамый популярный из уровней, в первую очередь благодаря своей экономичности. Жертвуя ради избыточности ёмкостью всего одного диска из массива, мы получаем защиту от выхода из строя любого из винчестеров тома. На запись информации на том RAID 5 тратятся дополнительные ресурсы, так как требуются дополнительные вычисления, зато при чтении (по сравнению с отдельным винчестером) имеется выигрыш, потому что потоки данных с нескольких накопителей массива распараллеливаются.

Недостатки RAID 5 проявляются при выходе из строя одного из дисков — весь том переходит в критический режим, все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность. Если в таком режиме выйдет из строя еще один диск, то вся информация будет потеряна. Поэтому, с томом RAID5 очень желательно использовать диск HotSpare. Если во время восстановления массива, вызванного выходом из строя одного диска, выйдет из строя второй диск - данные в массиве разрушаются. Уровень RAID 6 допускает выход из строя двух и более дисков.

Похож на RAID 5 но имеет более высокую степень надежности — под контрольные суммы выделяется емкость 2-х дисков, рассчитываются 2 суммы по разным алгоритмам. Требует более серьезный процессор контроллера — сложная математика. Обеспечивает работоспособность после выхода из строя 2-х дисков.

Комбинированные уровни RAID 0+1, RAID 10, RAID 50, RAID 60

Помимо базовых уровней RAID 0 — RAID 5, описанных в стандарте, существуют комбинированные уровни RAID 10, RAID 0+1, RAID 30, RAID 50, RAID 60 которые различные производители интерпретируют каждый по-своему.

Суть таких комбинаций заключается в следующем.

Это массив RAID-1 из двух массивов RAID-0. Как правило такой массив часто встречается на т.н. Host RAID-контроллерах. В случае с четырьмя дисками надежность и производительность соответствует RAID-10 из 4-х дисков.

— это массив RAID-0 из массивов RAID-1. Позволяет увеличивать производительность как у RAID-0 и иметь надежность выше чем у RAID-5. Теоретически допускает отказ до половины дисков. Гарантированно выдерживает отказ одного диска. Также достоинством данного массива является отсутствие требований к вычислительной мощности RAID-контроллера, а к недостаткам - потерю емкости половины всех дисков.

— это объединение в RAID-0 томов 5-го уровня. К такому решению прибегают, когда необходимо создать массив большой емкости из большого количества дисков. Дело в том, что чем больше дисков в массиве RAID-5, тем больше нагрузка на контроллер с расчетом контрольных сумм, и тем выше вероятность выхода из строя одновременно двух и более дисков, что неминуемо приведет к потере всей информации. Усугубляет ситуацию то, что в случае отказа одного из дисков, время восстановления массива на резервный диск (HotSpare) в течение которого массив остается беззащитным увеличивается пропорционально количеству дисков. Для решения этой проблемы применяется массив RAID 50. Уменьшая количество дисков томах RAID-5 мы снижаем время восстановления массива в случае сбоя, а также такой комбинированный уровень допускает выход из строя более одного диска из разных томов RAID-5

RAID 60 — Аналогично RAID-50, только в качестве базовых "кирпичиков" используются тома RAID-6.

Какой уровень RAID быстрее и почему?

На сегодняшний день самым быстрым уровнем RAID является RAID-0. теоретически его производительность кратна суммарной производительности всех дисков входящих в массив. Однако, данный уровень является абсолютно ненадежным, что ограничивает его использование в серверах.

Отказоусточивые массивы (RAID-1, RAID-10, RAID-5 и RAID-6) имеют различную производительность под разной нагрузкой, а также удельную стоимость хранения мегабайта информации на них.

Рассмотрим производительность различных уровней RAID.

Самый простой в реализации массив. Недостаток - полезная емкость = ½ совокупной емкости дисков. Однако, этот недостаток с лихвой окупается низкой стоимостью реализации подобного массива в сервере, т.к. большинство современных адаптеров интерфейсов (интегрированных на материнских платах, т.е. по сути «бесплатных») «умеют» делать массивы RAID-0 и 1. Такие массивы не требуют ресурсоемких вычислений, поэтому легко реализуемы и как следствие дешевы.

Производительность RAID-1 на чтение теоретически вдвое превосходит производительность одиночного диска. На запись - равна скорости одиночного диска. Учитывая невысокую стоимость как дисков, так и контроллера - этот массив можно рекомендовать для применения в ненагруженных серверах.

Этот уровень массива предполагает вычисления контрольных сумм при записи, что накладывает дополнительную нагрузку на процессор сервера, либо создает необходимость в приобретении аппаратного RAID-контроллера, стоимость которого как правило составляет стоимость 3-4 жестких дисков. В ряде случаев, от RAID-5 можно отказаться в пользу RAID-1 с сохранением, либо даже увеличением емкости. Например: Вам нужно построить массив емкостью 500Гб. Это можно сделать двумя путями:

1. Купить RAID-контроллер и 3 диска по 250Гб, что при создании RAID-5 даст полезную емкость в 500Гб

2. Использовать встренный на материнскую плату RAID-1, купить два диска по 500Гб и объединить их в RAID-1 получив полезную емкость массива те же 500Гб.

Стоимость второго решения, учитывая стоимость дисков может оказаться более чем в два раза ниже, чем первого. В данном случае RAID-5 не имеет приемуществ и по производительности. Наши исследования показали, что RAID-5 из трех дисков работает практически также, как RAID-1 из двух.

Однако, если в RAID-5 наращивать количество дисков, то его производительность на чтение растет практически линейно, что делает возможным использование такого типа массива в задачах, где преобладают операции чтения.

Использование данного массива целесообразно, когда количество дисков в массиве велико, и соответственно велика вероятность выхода из строя одновременно более одного диска. RAID-6 накладывает бОльшие требования к оборудованию по сравнению с RAID-5, что в целом снижает его производительность.

Современные RAID-контроллеры обладают мощными вычислительными ресурсами, которые позволяют провести переход с уровня RAID-5 к уровню RAID-6 без видимой потери производительности.

Массив сочетает в себе высокую надежность и производительно RAID-0. Производительность растет также как у RAID-0, с тем отличием, что элементами массива являются «наборы» RAID-1 из двух дисков. Массив обладает хорошей производительностью по записи и по чтению, что позволяет назвать его «универсальным». Однако, недостатком такого массива является большая потеря емкости исходных дисков (50%), что делает нерентабельным его использования в системах хранения данных с последовательным доступом.

В интернете есть масса статей с описанием RAID. Например, эта описывает все очень подробно. Но как обычно, читать все не хватает времени, поэтому надо что-нибудь коротенькое для понимания - а надо оно или нет, и что лучше использовать применительно к работе с СУБД (InterBase, Firebird или что то иное - на самом деле все равно). Перед вашими глазами - именно такой материал.

В первом приближении RAID это объединение дисков в один массив. SATA, SAS, SCSI, SSD - неважно. Более того, практически каждая нормальная материнская плата сейчас поддерживает возможность организации SATA RAID. Пройдемся по списку, какие бывают RAID и зачем они. (Хотел бы сразу заметить, что в RAID нужно объединять одинаковые диски. Объединение дисков от разных производителей, от одного но разных типов, или разных размеров - это баловство для человека, сидящего на домашнем компьютере).

RAID 0 (Stripe)

Грубо говоря, это последовательное объединение двух (или более) физических дисков в один "физический" диск. Годится разве что для организации огромных дисковых пространств, например, для тех, кто работает с редактированием видео. Базы данных на таких дисках держать нет смысла - в самом деле, если даже у вас база данных имеет размер 50 гигабайт, то почему вы купили два диска размером по 40 гигабайт, а не 1 на 80 гигабайт? Хуже всего то, что в RAID 0 любой отказ одного из дисков ведет к полной неработоспособности такого RAID, потому что данные записываются поочередно на оба диска, и соответственно, RAID 0 не имеет средств для восстановления в случае сбоев.

Конечно, RAID 0 дает ускорение в работе из-за чередования чтения/записи.

RAID 0 часто используют для размещения временных файлов.

RAID 1 (Mirror)

Зеркалирование дисков. Если Shadow в IB/FB это программное зеркалирование (см. Operations Guide.pdf), то RAID 1 - аппаратное зеркалирование, и ничего более. Упаси вас от использования программного зеркалирования средствами ОС или сторонним ПО. Надо или "железный" RAID 1, или shadow.

При сбое тщательно проверяйте, какой именно диск сбойнул. Самый частый случай погибания данных на RAID 1 - это неверные действия при восстановлении (в качестве "целого" указан не тот диск).

Насчет производительности - по записи выигрыш 0, по чтению - возможно до 1.5 раз, т. к. чтение может производиться "параллельно" (поочередно с разных дисков) . Для баз данных ускорение мало, в то время как при параллельном обращении к разным (!) частям (файлам) диска ускорение будет абсолютно точно.

RAID 1+0

Под RAID 1+0 имеют в виду вариант RAID 10, когда два RAID 1 объединяются в RAID 0. Вариант, когда два RAID 0 объединяются в RAID 1 называется RAID 0+1, и "снаружи" представляет собой тот же RAID 10.

RAID 2-3-4

Эти RAID являются редкими, т. к. в них используются коды Хэмминга, либо разбиение байт на блоки + контрольные суммы и т. п., но общее резюме таково - эти RAID дают только надежность, при 0-вом увеличении производительности, и иногда даже ее ухудшении.

RAID 5

Для него нужно минимально 3 диска. Данные четности распределяются по всем дискам массива

Обычно говорится, что "RAID5 использует независимый доступ к дискам, так что запросы к разным дискам могут выполняться параллельно". Следует иметь в виду, что речь идет, конечно, о параллельных запросах на ввод-вывод. Если такие запросы идут последовательно (в SuperServer), то конечно, эффекта распараллеливания доступа на RAID 5 вы не получите. Разумеется, RAID5 даст прирост производительности, если с массивом будут работать операционная система и другие приложения (например, на нем будет находиться виртуальная память, TEMP и т. п.).

Вообще RAID 5 раньше был наиболее часто используемым массивом дисков для работы с СУБД. Сейчас такой массив можно организовать и на SATA дисках, причем он получится существенно дешевле, чем на SCSI. Цены и контроллеры вы можете посмотреть в статьях
Причем, следует обратить внимание на объем покупаемых дисков - например, в одной из упомянутых статей RAID5 собирается из 4-х дисков объемом 34 гиг, при этом объем "диска" получается 103 гигабайта.

Тестирование пяти контроллеров SATA RAID - http://www.thg.ru/storage/20051102/index.html .

Adaptec SATA RAID 21610SA в массивах RAID 5 - http://www.ixbt.com/storage/adaptec21610raid5.shtml .

Почему RAID 5 - это плохо - https://geektimes.ru/post/78311/

Внимание! При закупке дисков для RAID5 обычно берут 3 диска, по минимуму (скорее из-за цены). Если вдруг по прошествии времени один из дисков откажет, то может возникнуть ситуация, когда не удастся приобрести диск, аналогичный используемым (перестали выпускаться, временно нет в продаже, и т. п.). Поэтому более интересной идеей кажется закупка 4-х дисков, организация RAID5 из трех, и подключение 4-го диска в качестве резервного (для бэкапов, других файлов и прочих нужд).

Объем дискового массива RAID5 расчитывается по формуле (n-1)*hddsize, где n - число дисков в массиве, а hddsize - размер одного диска. Например, для массива из 4-х дисков по 80 гигабайт общий объем будет 240 гигабайт.

Есть по поводу "непригодности" RAID5 для баз данных. Как минимум его можно рассматривать с той точки зрения, что для получения хорошей производительности RAID5 необходимо использовать специализированный контроллер, а не то, что есть по умолчанию на материнской плате.

Статья RAID-5 must die . И еще о потерях данных на RAID5 .

Примечание. На 05.09.2005 стоимость SATA диска Hitachi 80Gb составляет 60 долларов.

RAID 10, 50

Дальше идут уже комбинации из перечисленных вариантов. Например, RAID 10 это RAID 0 + RAID 1. RAID 50 - это RAID 5 + RAID 0.

Интересно, что комбинация RAID 0+1 в плане надежности оказывается хуже, чем RAID5. В копилке службы ремонта БД есть случай сбоя одного диска в системе RAID0 (3 диска) + RAID1 (еще 3 таких же диска). При этом RAID1 не смог "поднять" резервный диск. База оказалась испорченной без шансов на ремонт.

Для RAID 0+1 требуется 4 диска, а для RAID 5 - 3. Подумайте об этом.

RAID 6

В отличие от RAID 5, который использует четность для защиты данных от одиночных неисправностей, в RAID 6 та же четность используется для защиты от двойных неисправностей. Соответственно, процессор более мощный, чем в RAID 5, и дисков требуется уже не 3, а минимум 5 (три диска данных и 2 диска контроля четности). Причем, количество дисков в raid6 не имеет такой гибкости, как в raid 5, и должно быть равно простому числу (5, 7, 11, 13 и т. д.)

Допустим одновременный сбой двух дисков, правда, такой случай является весьма редким.

По производительности RAID 6 я данных не видел (не искал), но вполне может быть, что из-за избыточного контроля производительность может быть на уровне RAID 5.

Rebuild time

У любого массива RAID, который остается работоспособным при сбое одного диска, существует такое понятие, как rebuild time . Разумеется, когда вы заменили сдохший диск на новый, контроллер должен организовать функционирование нового диска в массиве, и на это потребуется определенное время.

Во время "подключения" нового диска, например, для RAID 5, контроллер может допускать работу с массивом. Но скорость работы массива в этом случае будет весьма низкой, как минимум потому, что даже при "линейном" наполнении нового диска информацией запись на него будет "отвлекать" контроллер и головки диска на операции синхронизации с остальными дисками массива.

Время восстановления функционирования массива в нормальном режиме напрямую зависит от объема дисков. Например, Sun StorEdge 3510 FC Array при размере массива 2 терабайта в монопольном режиме делает rebuild в течение 4.5 часов (при цене железки около $40000). Поэтому, при организации массива и планировании восстановления при сбое нужно в первую очередь думать именно о rebuild time. Если ваша база данных и бэкапы занимают не более 50 гигабайт, и рост в год составляет 1-2 гигабайта, то вряд ли имеет смысл собирать массив из 500-гигабайтных дисков. Достаточно будет и 250-гигабайтных, при этом даже для raid5 это будет минимум 500 гигабайт места для размещения не только базы данных, но и фильмов. Зато rebuild time для 250 гигабайтных дисков будет примерно в 2 раза меньше, чем для 500 гигабайтных.

Резюме

Получается, что самым осмысленным является использование либо RAID 1, либо RAID 5. Однако, самая частая ошибка, которую делают практически все - это использование RAID "подо все". То есть, ставят RAID, на него наваливают все что есть, и... получают в лучшем случае надежность, но никак не улучшение производительности.

Еще часто не включают write cache, в результате чего запись на raid происходит медленнее, чем на обычный одиночный диск. Дело в том, что у большинства контроллеров эта опция по умолчанию выключена, т.к. считается, что для ее включения желательно наличие как минимум батарейки на raid-контроллере, а также наличие UPS.

Текст
В старой статье hddspeed.htmLINK (и в doc_calford_1.htmLINK) показано, как можно получить существенное увеличение производительности путем использования нескольких физических дисков, даже для IDE. Соответственно, если вы организуете RAID - положите на него базу, а остальное (temp, OS, виртуалка) делайте на других винчестерах. Ведь все равно, RAID сам по себе является одним "диском", пусть даже и более надежным и быстродействующим.
признан устаревшим. Все вышеупомянутое вполне имеет право на существование на RAID 5. Однако перед таким размещением необходимо выяснить - каким образом можно делать backup/restore операционной системы, и сколько по времени это будет занимать, сколько времени займет восстановление "умершего" диска, есть ли (будет ли) под рукой диск для замены "умершего" и так далее, т. е. надо будет заранее знать ответы на самые элементарные вопросы на случай сбоя системы.

Я все-таки советую операционную систему держать на отдельном SATA-диске, или если хотите, на двух SATA-дисках, связанных в RAID 1. В любом случае, располагая операционную систему на RAID, вы должны спланировать ваши действия, если вдруг прекратит работать материнская плата - иногда перенос дисков raid-массива на другую материнскую плату (чипсет, raid-контроллер) невозможен из-за несовместимости умолчательных параметров raid.

Размещение базы, shadow и backup

Несмотря на все преимущества RAID, категорически не рекомендуется, например, делать backup на этот же самый логический диск. Мало того что это плохо влияет на производительность, но еще и может привести к проблемам с отсутствием свободного места (на больших БД) - ведь в зависимости от данных файл backup может быть эквивалентным размеру БД, и даже больше. Делать backup на тот же физический диск - еще куда ни шло, хотя самый оптимальный вариант - backup на отдельный винчестер.

Объяснение очень простое. Backup - это чтение данных из файла БД и запись в файл бэкапа. Если физически все это происходит на одном диске (даже RAID 0 или RAID 1), то производительность будет хуже, чем если чтение производится с одного диска, а запись - на другой. Еще больше выигрыш от такого разделения - когда backup делается во время работы пользователей с БД.

То же самое в отношении shadow - нет никакого смысла класть shadow, например, на RAID 1, туда же где и база, даже на разные логические диски. При наличии shadow сервер пишет страницы данных как в файл базы так и в файл shadow. То есть, вместо одной операции записи производятся две. При разделении базы и shadow по разным физическим дискам производительность записи будет определяться самым медленным диском.

Простейший рейд создается из двух жестких дисков, запись на которые производится поочередно, за счет чего и достигается повышение скорости. Из 2-х дисков можно построить и RAID 1 для увеличения отказоустойчивости, в этом случае данные дублируются на оба диска, так что при поломке одного накопителя ваши данные будут целы. Но вернемся к скоростному массиву.

Производители рейд - контроллеров рекомендуют использовать идентичные диски при создании массива. Оно и понятно, ведь два разных диска, будут иметь и различные показатели в скорости чтения/записи и т.д. Желательно что бы и объем дисков совпадал. В моем случае я использовал два диска от одного производителя с идентичными характеристиками за исключение размера памяти.
Перейдем пожалуй к самому процессу создания RAID-массива.

Платформа - системная плата Asus M2N32-SLI Deluxe.

Диски SATA: 80 ГБ и 160 Гб.

Диски устанавливаем в системный блок и соединяем с материнской платой SATA-кабелями.

Не забываем про питание жестких дисков. Если у вашего блока питания нет свободных SATA-разъемов, но есть свободные molex-разъемы, то используем переходники.

И вот наконец то все подключено! Включаем компьютер и заходим в БИОС. На вкладке MAIN видим в какие порты подключены диски. Номера портов нужно запомнить для дальнейшей настройки.

Переходим в ADVANCED и ентерим пункт Onboard Device Configuration.

Тут видим что рейд отключен. Не порядок, нужно поправить.

Переводим RAID Enabled в Enabled и включаем, те SATA к которым подключили диски.

Сохраняем настройки BIOS, нажатием на F10, или SAVE & EXIT SETAP в пункте EXIT.

Компьютер выполнит перезагрузку и в это время нужно нажать на F10 для входа в утилиту настройки рейд-массива.

И вот она, оболочка настройки RAID. Тут активное окно или окошко подсвечивается бирюзовым цветом. В первом пункте RAID Mode выбираем Striping . Это и есть интересующий нас , увеличивающий скорость системы.

Теперь в окошке Striping Block выставляем значение 128K.

Нажимаем F7 для закрепления настроек массива и соглашаемся с тем, что все данные на дисках будут затерты.

Затем, автоматически откроется следующий этап, на котором нужно будет сделать, созданный рейд-диск, загрузочным. Для этого нужно нажать "B", а потом ENTER.

Откроется заключительное окно с обзоров включенных в RAID дисков. Просто жмем ENTER.

И тут хочу заметить, что общий объем массива составит сумму двух дисков. Но так как технология заточена под работу с одинаковыми дисками, то мы получим умноженный на два объем наименьшего диска в массиве.

При перезагрузке видим, что RAID успешно создан.

Для установки операционной системы на вновь созданный массив из двух HDD, в меню bios, во вкладке BOOT, заходим в Hard Disk Drives и выставляем RAID 0 на первую строчку.


Windows XP SP3 на мой RAID 0 встал вообще без проблем. Хочу заметить, что Windows сборка использовалась с интегрированными sata-драйверами.
Приведу пример, для сравнения, скорости работы одиночного диска и RAID-массива, сделанного с помощью программы:

HD Tach .

Результат очень даже ничего и не оставляет сомнений в том, что время потрачено не зря.

Красным цветом помечен РЕЙД на контроллере NVIDIA, созданный мной.

Я боюсь представить себе нереальный прирост производительности и секундную скорость загрузки операционной системы, если данную операцию провернуть с использованием SSD - дисков. Ведь вы уже наверняка знаете о быстрых твердотельных накопителях. Но это уже совсем другая история.

Один SSD против двух в RAID | Два лучше, чем один?

Всего за несколько лет твердотельный накопитель превратился из дорогого экзотического продукта в один из основных комплектующих высокопроизводительных ПК или ноутбуков. Как уже известно, это было обусловлено двумя основными факторами: во-первых, SSD обладают гораздо более высоким быстродействием, чем жёсткие диски, и на порядок более эффективны. Во-вторых, цена за гигабайт NAND-памяти продолжает снижаться благодаря новым технологическими достижениям и экономии за счет роста производства.

Сегодня можно найти множество моделей ёмкостью 128 Гбайт по цене ниже $100. Переход на носители объёмом 256 Гбайт зачастую означает ещё более выгодную цену за гигабайт (почти всегда менее $1, а иногда и $ 0,60 за Гбайт).

Сейчас твердотельные накопители достигли в своем развитии такого уровня, что компьютерные энтузиасты должны принять важное решение: купить один ёмкий SSD или приобрести пару SSD-накопителей меньшей ёмкости и объединить их в конфигурацию RAID 0. Это в значительной степени вопрос производительности. Мы знаем, что производительность одиночных накопителей ограничена возможностями интерфейса SATA 6 Гбит/с. Но существуют ли задачи, требующие пропускной способности двух совместно работающих SSD (в особенности, при последовательной передаче данных)?

Мы попытаемся ответить на этот вопрос, протестировав производительность современных твердотельных накопителей разных ёмкостей. Компания Samsung предоставила нам шесть своих SSD: две модели Samsung 840 Pro по 128 Гбайт, которые будут противостоять модели ёмкостью 256 Гбайт и еще два накопителя по 256 Гбайт для сравнения с ёмкой моделью 512 Гб.

Если вы хотите более подробно узнать о Samsung 840 Pro , ознакомьтесь с нашим обзором "SSD Samsung 840 Pro: непревзойденная скорость, меньшее энергопотребление" , а также с нашими последними исследованиями в статье "Установка SSD в систему с SATA 3 Гбит/с: Есть ли смысл?" .

Один SSD против двух в RAID | Тестовый стенд и бенчмарки

Чтобы измерить и сравнить производительность различных конфигураций из двух и одного SSD Samsung 840 Pro , мы использовали наш свежий набор тестов для твердотельных накопителей. Сначала мы протестировали их по отдельности: по одному SSD объёмом 128, 256 и 512 Гбайт. Затем мы объединили два твердотельных накопителя по 128 Гбайт и два по 256 Гбайт в RAID 0 и провели серию тестов этих массивов.

Реалистичные тесты:

  1. Загрузка . Отсчёт начинается с момента, когда экран POST показывает нули и заканчивается, когда появляется рабочий стол Windows.
  2. Выключение . После трёх минут работы мы выключаем систему и начинаем отсчёт. Таймер останавливается, когда система выключена.
  3. Загрузка и Adobe Photoshop. После загрузки командный файл запускает редактор изображений Adobe Photoshop CS6 и загружает фотографию с разрешением 15 000x7 266 пикселей и размером 15,7 Мбайт. После Adobe Photoshop закрывается. Отсчёт начинается после экрана POST и заканчивается, когда Adobe Photoshop выключен. Мы повторяем тест пять раз.
  4. Пять приложений. После загрузки командный файл запускает пять различных приложений. Отсчёт начинается с запуском первого приложения и заканчивается с закрытием последнего. Мы повторяем тест пять раз.

Скриптовая последовательность для теста пяти приложений:

  • Загрузка презентации Microsoft PowerPoint и затем закрытие Microsoft PowerPoint.
  • Запуск рендерера командной строки Autodesk 3ds Max 2013 и рендеринг изображения в разрешении 100x50 пикселей. Картинка такая маленькая, потому что мы тестируем SSD, а не CPU.
  • Запуск встроенного в ABBYY FineReader 11 бенчмарка и конвертирование тестовой страницы.
  • Запуск встроенного в MathWorks MATLAB бенчмарка и его выполнение (один раз).
  • Запуск Adobe Photoshop CS6 и загрузка изображения, которое использовалось в третьем тесте реальной производительности, но в оригинальном формате TIF с разрешением 29 566x14 321 пикселей и размером 501 Мбайт.

Тестовый стенд

Конфигурация тестового стенда
CPU Intel Core i7-3770K Extreme Edition (22 нм Ivy Bridge), 4 ядра/4 потока, 3,5 ГГц, кэш L2 4 x 256 Кбайт, общий кэш L3 6 Мбайт, TDP 95 Вт, 3,9 ГГц max. Turbo Boost
Материнская плата Asus P8Z77-V Pro, Chipset: Intel Z77 Express, BIOS: 1805
Оперативная память 2 x 8 Гбайт DDR3-1600 CL10-10-10-27 (Corsair Vengeance CMZ16GX3M2A1600C10)
Системный SSD (тесты ввода/вывода и общей производительности) Samsung 840 Pro, 256 Гбайт, Прошивка DXM04B0Q, SATA 6 Гбит/с
Тестируемые SSD Samsung 840 Pro, 128 Гбайт, Прошивка DXM04B0Q, SATA 6 Гбайт/с
Samsung 840 Pro, 256 Гбайт, Прошивка DXM04B0Q, SATA 6 Гбайт/с
Samsung 840 Pro, 512 Гбайт, Прошивка DXM04B0Q, SATA 6 Гбайт/с
Питание Seasonic X-760 760 Вт, SS-760KM Active PFC F3
Тесты
Общая производительность h2benchw 3.16
PCMark 7 1.0.4
Производительность ввода/вывода IOMeter 2006.07.27
Fileserver-Benchmark
Webserver-Benchmark
Database-Benchmark
Workstation-Benchmark
Линейное чтение
Линейная запись
Случайное чтение блоков по 4 Кбайта
Случайная запись блоков по 4 Кбайта
Реалистичные тесты 3ds Max 2013
Finereader 11
Matlab 2012b
Photoshop CS6
Powerpoint 2010
ПО и драйверы
Операционная система Windows 8 x64 Pro
Intel RST 11.7.0.1013

Один SSD против двух в RAID | Результаты тестов

Скорость последовательного чтения и записи

Как и ожидалось, конфигурации из двух SSD на 128 Гбайт и 256 Гбайт в RAID 0 в нашем тесте последовательного чтения с лёгкостью обошли одиночные накопители. По сути, два диска ёмкостью 256 Гбайт с чередованием данных обеспечивают примерно вдвое более высокую производительность, чем один SSD. Два SSD по 128 Гбайт не так сильны в последовательной записи, но этого следовало ожидать, учитывая результат отдельного накопителя Samsung 840 Pro 128 Гбайт.

Согласно характеристикам Samsung, модель Samsung 840 Pro 128 Гбайт демонстрирует меньшую скорость чтения и записи, чем более ёмкие версии. Итак, мы получаем стабильные результаты.

Скорость произвольных операций блоками по 4 Кбайт (AS-SSD)

В настольных системах вы чаще всего сталкиваетесь с низкой глубиной очереди. Все конфигурации в этом случае работают почти одинаково. Фактически объединённые накопители даже немного медленнее, чем одиночные диски. Это происходит потому, что мы заполняем полосу пропускания флэш-памяти NAND. Для распределения нагрузки между несколькими устройствами на нескольких каналах необходим параллелизм.

Сразу после перехода на очень высокую глубину разница между работой обеих конфигураций и одиночными накопителями в RAID 0 становится более заметной. Жаль, что такие условия не характерны для задач, исполняемых на обычных ПК, и такие показатели Samsung 840 Pro можно наблюдать в основном в корпоративных средах.

Скорость произвольного чтения и записи блоками по 4 Кбайт (Iometer)

Наш тест Iometer очень хорошо демонстрирует связь между глубиной очереди и скоростью произвольного чтения и записи.

Диаграммы ниже отражают зависимость средней скорости передачи данных от глубины очереди, которая может составлять от 1 до 32. Как видно из измерений, в произвольном чтении блоками по 4 Кбайт лидируют две конфигурации RAID 0. С результатами скорости записи ситуация не так очевидна. Samsung 840 Pro на 512 Гбайт обходит два SSD ёмкостью 128 Гбайт, которые сами по себе лишь немного быстрее, чем одиночный SSD на 256 Гбайт.


Однако график роста производительности на разных глубинах очереди более нагляден. Операции чтения при низкой глубине очереди, похоже, снова ограничены возможностями NAND-памяти, и преимущества RAID 0 проявляются лишь при значительной степени параллелизма конфигурации. Запись даёт более высокую нагрузку: два накопителя по 256 Гбайт едва обходят один SSD на 512 Гбайт, а два Samsung 840 Pro по 128 Гбайт работают чуть быстрее, чем накопитель на 256 Гб.


Время доступа

Результаты тестов показывают, что все конфигурации с одним накопителем обеспечивают более низкий показатель времени доступа, чем объединённые массивы. Однако различия совсем небольшие.

Тесты различных профилей ввода/вывода (Iometer)

Диаграммы представляют среднюю производительность на глубине очереди от 1 до 32 в трёх тестовых профилях: базе данных (Database), веб-сервере (Web server) и рабочей станции (Workstation).


В тестовом профиле веб-сервера Iometer два массива RAID 0 явно обгоняют одиночные накопители на любой глубине очереди. Угадайте, какая модель доступа преобладает в этом тесте? Правильно, 100% чтение.


Тем не менее, профили базы данных и рабочей станции показывают меньшее масштабирование производительности при глубине очереди до восьми. До этого момента Samsung 840 Pro ёмкостью 512 Гбайт работает примерно так же, как два SSD по 256 Гбайт в RAID 0. Такая же тенденция прослеживается и для одного SSD на 256 Гбайт и двух объединённых дисков по 128 Гбайт.


Синтетические тесты PCMark 7 и PCMark Vantage демонстрируют практически идентичную производительность всех конфигураций SSD. Более заметные различия наблюдаются при отдельных рабочих нагрузках, но они, похоже, взаимоисключаемы.


PCMark Vantage


Тест копирования AS-SSD и общая производительность

Копирование файлов – это операция, для выполнения которой хорошо иметь производительную систему данных, такую, как SSD в конфигурации RAID. В трёх тестах копирования два SSD в связке превысили ограничения интерфейса SATA 6 Гбит/с, показав более высокую пропускную способность, чем может обеспечить любой накопитель в одиночку.

Общая производительность

Благодаря превосходной производительности массивы RAID 0 выигрывают в ряде синтетических тестов как по общему баллу AS-SSD, так и по производительности в условиях нагрузок, свойственных настольным системам. Но всё не так-то просто: реалистичные тесты рисуют иную картину. Высочайшая пиковая скорость последовательной передачи данных в синтетических тестах не обязательно означает такие же показатели в реальности.


Быстрее всего наша тестовая система под управлением загружается на одном Samsung 840 Pro 256 Гб, за ним следует модель ёмкостью 512 Гбайт. Два массива RAID 0 занимают третье и четвёртое места, а замыкает список один накопитель на 128 Гбайт. Тем не менее, разница между первым и последним местом составляет всего 1,1 секунды.


При выключении , лидирует массив RAID из двух SSD по 128 Гбайт. Опять же, перевес незначительный. Разница между первым и последним местом составляет всего лишь 0,4 секунды.


Наш третий реалистичный тест показывает почти такой же результат, что и первые два. Нет практически никакой разницы между конфигурациями из одного SSD или двух в RAID 0. В данном тесте мы загружаем , запускаем Adobe Photoshop CS6 и загружаем изображение.


Реалистичные тесты: Пять приложений

При проведении четвертого и последнего реалистичного теста мы вновь испытали дежавю. После загрузки мы запустили несколько приложений. Различные конфигурации SSD ведут себя идентично, лишь Samsung 840 Pro ёмкостью 512 Гбайт показал незначительный отрыв.


Один SSD против двух в RAID | RAID 0 - отличный вариант для тестов, но не в реальном мире

Забавная вещь тестирование SSD. Вы можете целый день запускать синтетические испытания, создавая нереальные рабочие нагрузки, которые раскрывают твердотельные накопители с одной стороны. Затем вы можете провести реалистичные тесты, которые рисуют совсем другую картину.

Для энтузиастов зачастую лучше всего подходит золотая середина. Большинство выполняемых задач действительно включают в себя основные операции, такие как открытие веб-браузера, редактирование изображений, работа с электронной почтой и просмотр видео. Но иногда от наших систем требуется более высокая производительность, например, для компиляции большого проекта, перемещения десятков гигабайт медиафайлов или захвата несжимаемых файлов AVI для анализа FCAT. В таких случаях хочется получить требуемое быстродействие.

Как мы и ожидали, два твердотельных накопителя в массиве RAID 0 демонстрируют феноменальные показатели последовательного чтения и записи. В обоих тестах показатели RAID 0 из двух Samsung 840 Pro по 256 Гбайт достигают почти 1 Гбайт/с. В значительной степени из-за ограничений интерфейса SATA 6 Гбит/с показатели одиночных накопителей достигают чуть более половины этих значений.

Конфигурации на базе RAID, несомненно, лидировали в первом тесте, показывая исключительные результаты в рамках последовательного чтения и записи, однако для одиночных накопителей игра ещё не была проиграна. Отдельные твердотельные накопители отвоевали позиции в последующих тестах, даже показав в некоторых из них лучшие результаты. Хорошим примером является скорость произвольных операций ввода/вывода. Накопители с чередованием данных, безусловно, обеспечивают больше IOPS, но только в случае, если вы даёте более четырёх команд сразу. Очерёдность в 32, 16 или даже 8 команд совсем не характерна для настольных ПК или рабочих станций. В результате на практике разница в производительности выражена гораздо меньше.

Одиночные SSD неоднократно лидировали в проведённых нами тестах. Разницу в производительности при перезагрузке и выключении , а затем при запуске различных приложений в лучшем случае можно назвать минимальной, а на практике она вообще не заметна. Иногда отдельные накопители даже умудрялись превзойти RAID массивы.

Если вы планируете обновление и хотите знать, стоит ли покупать пару SSD по 128 Гбайт и объединять их в RAID 0 или, например, просто купить один накопитель ёмкостью 256 Гбайт, ответ для нас очевиден: один накопитель большей ёмкости лучше. К примеру, в данный момент приобретение пары SSD Samsung 840 Pro по 128 Гбайт обойдется вам в $300. Модель ёмкостью 256 Гбайт стоит $240 (может быть, поэтому её сейчас и нет в наличии). Также встаёт вопрос о надёжности. Если один из дисков в конфигурации RAID 0 даёт сбой – то это касается всего массива. По крайней мере, в качестве основного системного накопителя один SSD является более безопасным вариантом.

Есть, конечно, и исключения. Предел интерфейса SATA 6 Гбит/с в настоящее время составляет 500+ Мбайт/с для чтения и до 500 Мбайт/с для записи. Иногда этого просто недостаточно. В качестве примера возьмите необработанные видеоролики в формате AVI, упомянутые ранее. Чтоб не пропускать кадры, мы используем четыре Crucial m4 в RAID 0. В этом случае RAID 0 – обязательное условие, и тот факт, что в массиве находится только отснятое видео, означает, что сбой массива приведет к относительно поверхностным потерям (за исключением стоимости диска). Если вы используете подобное приложение, то наверняка знаете, что один накопитель большого объёма не справится с такой задачей.

При создании файлового сервера или производительной рабочей станции часто приходится сталкиваться с проблемой выбора конфигурации дисковой подсистемы. Современные материнские платы, даже бюджетного уровня, предлагают возможность создания RAID массивов всех популярных уровней, не стоит также забывать и о программной реализации RAID. Какой из вариантов будет надежнее и производительнее? Мы решили провести свое тестирование.

Тестовый стенд

Как правило в организациях малого и среднего бизнеса на роль файловых серверов, серверов уровня отдела и т.п. используется обычный ПК, собранный из обычных, бюджетных, комплектующих. Целью нашего тестирования было изучение производительности дисковой подсистемы собранной с помощью RAID контроллера чипсета и его сравнение с программными реализациями RAID массивов (средствами ОС). Поводом для проведения тестирования стало отсутствие в широком доступе объективных тестов бюджетных RAID, а также большое количество "мифов и легенд" по этому вопросу. Мы специально не подбирали железо, а воспользовались тем, что было под рукой. А под рукой оказались несколько обычных ПК для очередного внедрения, один из которых был использован в качестве тестового стенда.

Конфигурация ПК:

  • Материнская плата: ASUS M4N68T-M SocketAM3
  • Процессор: CPU AMD ATHLON II X2 245 (ADX245O) 2.9 ГГц/ 2Мб/ 4000МГц Socket AM3
  • Оперативная память: 2 х Kingston ValueRAM DDR-III DIMM 1Gb
  • Жесткие диски: HDD 320 Gb SATA-II 300 Western Digital Caviar Blue 7200rpm 16Mb
  • Операционная система: Windows Server 2008 SP2 (32-bit)
  • Файловая система: NTFS

Дисковая подсистема была сконфигурирована следующим образом: на один диск была установлена операционная система, из двух или трех других собирался RAID массив.

Методика тестирования

В качестве тестового ПО нами был выбран Intel NAS Performance Toolkit , данный пакет представляет набор тестов, позволяющий оценить производительность дисковой подсистемы на основных характерных задачах. Каждый тест выполнялся пять раз, конечный результат представляет среднее значение. За эталон мы взяли производительность одиночного жесткого диска.

Нами были протестированы массивы RAID0, RAID1 и RAID5, причем RAID5 был протестирован как в нормальном режиме, так и в аварийном, с одним изъятым диском. Почему в аварийном режиме мы протестировали только этот массив? Ответ прост: для RAID0 такого режима не существует, при отказе любого из дисков массив разрушается, а единственный оставшийся диск RAID1 ничем ни будет отличатся от одиночного диска.

Тестировались как аппаратные, так и программные реализации, первоначально мы еще замеряли среднюю загрузку ЦПУ, так как бытует мнение, что программный RAID сильно грузит процессор. Однако от включения данного замера в результаты тестов мы отказались, нагрузка на процессор оказалась приблизительно равна и составила около 37-40% для одиночного диска, RAID0, RAID1 и 40-45% для RAID5.

Файловые операции

Классическими операциями для любого накопителя являются операции чтения и записи. В Intel NASPT эти параметры оцениваются в четырех тестах: копирование на накопитель и обратно файла размером 247 Мб и 44 папок содержащих 2833 файла общим объемом 1,2 Гб.

Чтение / запись файлов

Если обратить внимание на результаты эталонного диска, то увидим, что скорость записи почти вдвое (на 89%) выше скорости чтения. Это связано с особенностями работы файловой системы и этот факт также следует учитывать. RAID0 (чередующийся массив), вне зависимости от способа реализации показал на 70% более высокую производительность, чем одиночный диск, в то время как скоростные параметры RAID1 (зеркало) полностью ему идентичны.

Отдельного разговора заслуживает RAID5, скорость записи на него неприемлемо низкая, замедление составляет до 70%, в то время как скорость чтения не уступает быстрому RAID0. Возможно это связано с недостатком вычислительных ресурсов и несовершенством алгоритмов, ведь при записи тратятся дополнительные ресурсы для вычисление контрольной суммы. При отказе одного из дисков скорость записи падает, у аппаратного решения спад менее выражен (15%), чем у программного (40%). Скорость чтения при этом падает значительно и соответствует скорости одиночного диска.

Чтение / запись папок

Каждый, кто пробовал скопировать россыпь мелких файлов, знает - лучше предварительно запаковать их в архив, так будет значительно быстрее. Наши тесты только подтверждают это эмпирическое правило, чтение россыпи мелких файлов и папок почти на 60% медленнее, чтения крупного файла, скорость записи также незначительно (10%) ниже.

RAID0 дает гораздо меньшее преимущество на операциях записи (30-40%), а на операциях чтения разницей вообще можно пренебречь. RAID1 ожидаемо не подносит нам никаких сюрпризов, идя один в один с одиночным диском.

RAID5 на мелких файлах показывает гораздо более лучший результат, но все равно продолжает уступать одиночному диску в среднем 35%. Скорость чтения ничем не отличается от остальных конфигураций, мы склонны считать, что в данном случае сдерживающим фактором является время произвольного доступа винчестера. А вот при изъятии из массива одного диска мы получили весьма неожиданный результат, который заставил нас его несколько раз перепроверить, в том числе и на другой модели винчестеров (500 Gb Seagate/Maxtor Barracuda 7200.12/DiamondMax 23 <3500418AS> 7200rpm 16Mb). Дело в том, что скорость записи аппаратного массива резко упала (почти в три раза), а скорость записи программного RAID5 наоборот выросла, возможно это связано с алгоритмом программной реализации массива. И все же мы предпочитаем оставить данный "феномен" без комментариев.

Работа с приложениями

Следующие тесты отражают производительность дисковой подсистемы при работе с различного рода приложениями, прежде всего офисными. Первый тест (Content Creation) отражает использование диска для хранения и работы с данными, пользователь создает, открывает, сохраняет документы не проявляя особой активности. Наиболее мощный тест - Office Productivity, он моделирует активную работу с документами, поиск информации в интернете (на накопитель сбрасывается кэш браузера), в общей сложности 616 файлов в 45 каталогах объемом 572 Мб. Последний тест - работа с фотоальбомом (преимущественно просмотр), более характерен для домашнего применения, включает в себя 1,2 Гб фото (169 файлов, 11 каталогов).

Работа с документами

При работе с одиночными файлами RAID0 вполне предсказуемо почти в два раза опережает RAID1 и одиночный жесткий диск (тест Content Creation), однако при активной работе теряет все свои преимущества, в тесте Office Productivity RAID0, RAID1 и одиночный диск показывают одинаковые результаты.

RAID5 в данных тестах явный аутсайдер, на одиночных файлах производительность массива крайне низка, причем аппаратная реализация показывает гораздо более лучший (но все равно крайне низкий) результат. При активной офисной работе результаты гораздо лучше, но все равно ниже чем у одиночного диска и более простых массивов.

Работа с фотографиями

В данном режиме все массивы показали примерно одинаковый результат, сравнимый с производительностью одиночного диска. Хотя RAID5 показал несколько более низкий результат, хотя в данном случае отставание вряд ли удастся заметить "невооруженным глазом".

Мультимедиа

Ну и напоследок мультимедийные тесты, которые мы разбили на две части: воспроизведение и запись. В первом случае с накопителя воспроизводится HD видео в один, два и четыре потока одновременно. Во втором производится запись и одновременная запись - воспроизведение двух файлов. Данный тест применим не только к видео, так как характеризует общие процессы линейной записи / чтения с дискового массива.

Воспроизведение

RAID0

Данный вид дискового массива уверенно лидирует при работе с крупными файлами и мультимедиа. В большинстве случаев позволяет достичь значительного преимущества (около 70%) по сравнению с одиночным диском, однако имеет один существенный недостаток - крайне низкую отказоустойчивость. При выходе из строя одного диска разрушается весь массив. При работе с офисными приложениями и фотографиями особых преимуществ не имеет.

Где можно применять RAID0? В первую очередь на рабочих станциях, которым по роду задач приходится работать с большими файлами, например, видеомонтаж. Если требуется отказоустойчивость можно применить RAID10 или RAID0+1 которые представляют чередующийся массив из двух зеркал или зеркало из чередующихся массивов, данные уровни RAID сочетают скоростные параметры RAID0 и надежность RAID1, из недостатков можно назвать существенные накладные расходы - для хранения используется только половина емкости дисков входящих в массив.

RAID1

Никаких скоростных преимуществ перед одиночным диском "зеркало" не имеет, основная задача этого массива - обеспечение отказоустойчивости. Рекомендуется к применению при работе с офисными файлами и мелкими файлами, т.е. на тех задачах где разница между более скоростными массивами не столь велика. Неплохо подойдет для работы с 1С:Предприятие 7.7 в файловом режиме, который по характеру работы с диском представляет нечто среднее между Office Productivity и Dir copy from / to NAS. Для более производительных задач не рекомендуется, здесь стоит обратить внимание на RAID10 и RAID0+1.

RAID5

Мы бы не рекомендовали применять этот вид массива в бюджетных системах, на операциях записи RAID5 значительно проигрывает даже одиночному жесткому диску. Единственная сфера, где его применение будет оправдано, это создание медиасерверов для хранения мультимедийных данных, основной режим которых - чтение. Здесь на первый план выходят такие параметры как высокая скорость чтения (на уровне RAID0) и меньшие накладные расходы на обеспечение отказоустойчивости (1/3 емкости массива), что дает неплохой выигрыш при создании хранилищ значительного объема. Однако следует помнить, что попытка записи на массив приводит к резкому снижению производительности, поэтому заливку новых данных на подобные медиасервера следует производить в часы наименьшей загруженности.

Аппаратный или программный?

Результаты тестов не выявили каких либо заметных достоинств или недостатков для обоих вариантов реализации, разве что RAID5, аппаратный вариант которого показывал в ряде случаев более высокий результат. Поэтому следует исходить из других особенностей. Таких как совместимость и переносимость.

Аппаратные RAID реализуются силами южного моста чипсета (либо отдельным контроллером) и требуют поддержки со стороны ОС, либо подгрузки драйверов на стадии установки. Этот же факт делает зачастую невозможным использование ряда дисковых и системных утилит использующих собственные загрузочные диски, если их загрузчик не имеет поддержки RAID контроллера, то ПО просто не увидит вашего массива.

Второй недостаток - привязка к конкретному производителю, если вы решитесь сменить платформу или выберете материнскую плату с другим чипсетом вам придется скопировать свои данные на внешний носитель (что само по себе бывает проблемно) и собирать массив заново. Главная неприятность заключается в том, что при неожиданном выходе материнской платы из строя вам придется искать аналогичную модель для получения доступа к своим данным.

Программный RAID поддерживается на уровне OC, поэтому во многом лишен этих недостатков, массив легко собирается и легко переносится между аппаратными платформами, в случае выхода из строя оборудования доступ к данным можно легко получить на другом ПК, имеющем совместимую версию Windows (младшие редакции не поддерживают динамических дисков).

Из недостатков следует отметить невозможность установки Windows на тома RAID0 и RAID5, по той причине, что установка Windows на динамический том возможна только тогда, когда этот том был преобразован из базового загрузочного или системного тома. Подробнее о динамических томах можно прочитать .

  • Теги:

Please enable JavaScript to view the comments powered by Disqus.

Трекбэк

При создании файлового сервера неизбежно возникает вопрос выбора операционной системы. Здесь есть над чем задуматься: потратить деньги на Windows Server или обратить внимание на бесплатные Linux и BSD? Во втором случае придется еще определиться с выбо...



Рекомендуем почитать

Наверх