Может скажите простым языком что лучше всего делать в моем случае?
Просто добавить полно дисков и раскидывать по ним файлы, или тот же файл
по всем диском раскидать и затем через скрипт рандомально запрашивать по
дискам?
Лучше просто добавить дисков и рандомно раскидывать файлы, тогда будет
вероятность что парочка из них закешируется и веникам будет легче. Для
бекапа я б сделал бы на соседних вениках папки и синхронизировал раз в
сколько не жалко, в конфиг бы дописал через try_files эти самые папки с
бекапом чтобы вообще исключить простой в случае чего. Получится вариант
почти рейд1 но с производительностью standalone дисков.
по какой причине этот вариант "почти рейд1" реализованный
скриптами и через try_files будет лучше нормального raid1 ?
есть ли данные экспериментов linux mdraid + XFS + flv streaming,
которые подтверждают, что "независимые" винты будут лучше raid1
(нормального (не глючного) програмного или нормального аппаратного)?
когда этот вариант будет хуже - я уже писал, если какой-то файл
становится очень популярным, то винт с ним становится перегруженным
запросами, а все остальные винты при этом будут практически простаивать, и суммарная производительность сервера будет меньше, чем могла бы быть в случае использования нормального, а не "самодельного" raid1 массива.
кстати, в raid1 массиве не обязательно должно быть всего 2 винта.
вполне может быть 2, 3, 4, 5, 6, 7, ... с соответствующим ростом производительности массива raid1 при множественных random read.