Freebox Server (Pop V8/ Delta V7 / Revolution V6 / Server Mini 4K)

  • État En attente de réponse
  • Type de tâche Anomalie
  • Catégorie Freebox OS
  • Assignée à Personne
  • Système d'exploitation Freebox Server V7 (Delta)
  • Sévérité Haute
  • Priorité Normale
  • Basée sur la version 4.4.0
  • Due pour la version Non décidé
  • Date d'échéance Non décidé
  • Votes 0
  • Privée Non
Concerne le projet: Freebox Server (Pop V8/ Delta V7 / Revolution V6 / Server Mini 4K)
Ouverte par Simon (SimR69) - 01/07/2021
Dernière édition par Anisse Astier (aastier) - 05/07/2021

FS#35143 - Échec récupération RAID 5 et pertes des données après remplacement d’un disque défectueux

Bonjour,

J’avais trois disques durs internes de 500 Go montés en RAID 5, pour assurer une certaine sécurité de mes données.

Lors d’un passage dans l’interface de Freebox OS, je m’aperçois qu’un des disques est défectueux. Le RAID fonctionne alors en mode dégradé, mais il fonctionne malgré tout, comme c’est prévu avec le RAID 5.

J’investis alors dans un nouveau disque dur SATA, que je branche en remplacement du précédent.

Après une petite recherche dans l’interface pour réintégrer le nouveau disque au RAID, je trouve l’option dans l’onglet Array Raid des paramètres de Disque. Le système procède alors à une «Récupération», avec un pourcentage.

La récupération échoue.

Après plusieurs tentatives et redémarrages de la Freebox, non seulement la récupération échoue encore, mais la situation s’aggrave : je perds totalement l’accès à mon RAID. La Freebox ne monte plus aucun volume.

C’est une catastrophe compte tenu de l’importance de ces données, que j’avais choisi de monter en RAID 5 plutôt que d’effectuer une sauvegarde manuelle. J’ai l’impression que votre système de RAID souffre de problèmes de fiabilité au regard du caractère critique de cette fonction.

Merci de me venir en aide. Si vous avez besoin de plus d’informations, n’hésitez pas.

Cette tache ne dépend pas d'autre tache

Anisse Astier (aastier)
vendredi 2 juillet, 2021 08:29:17

Bonjour, pourriez-vous nous donner l’adresse MAC de votre Freebox Server, ainsi qu’indiquer quel disque était défectueux, et par lequel l’avez-vous remplacé ? (marque/modèle/serial du disque ou port SATA concerné)

D.-C.M. (Freemagician)
vendredi 2 juillet, 2021 13:01:57

Sur mes expériences passées donc pas liées à la Freebox, je n’ai jamais réussi à récupérer des systèmes RAID5
J’ai fait des tests sur des RAID5 matrix Intel, le machin il tourne une semaine entière 24/24h pour échouer à la fin

Ca fait belle lurette que j’ai complètement abandonné ces RAID5... je ne fait que du RAID0 pour la perf, mais derrière je sauvegarde régulièrement, ou je synchronise avec un autre système physiquement indépendants

Je ne saurais qu’alerter toute la communauté que le RAID5 c’est de la merde, c’est une douce illusion, un attrape nigaud de service

La probabilité de récupération N’EST JAMAIS ASSURE A 100%, et veuillez tous vous renseigner, tous les forum spécialisés vous le diront le RAID5, comme le RAID1 NE SONT PAS DES SOLUTIONS DE SAUVEGARDE, ce sont des solutions visant à maintenir la continuité du service.

N’étant pas une solution de sauvegarde, RAID5 ou RAID1, CELA NE VOUS DISPENSE PAS DE FAIRE DES SAUVEGARDES, ou régulièrement répliquer les données sur un système jumeau physiquement séparé.
C’est l’erreur commise par 99.9% des geeks moyens qui confondent sauvegarde et continuité de service.

Déjà sur une sauvegarde en général on utilise les outils d’imagerie incrémentielle qui permet de garder un historique de modification
Admettons que vous fassiez tourner Windows sur un RAID5, vous chopez un virus, votre RAID5 il est mort... de la même manière que votre RAID 1 puisque le deuxième disque n’a fait que répliquer en temps réel la merde qu’il y a sur le disque numéro 1

J’utilise cet exemple particulier pour essayer de vous faire comprendre à tous la différence entre solution de sauvegarde et continuité de service que le geek bas de gamme n’arrive pas à comprendre.

Dans ce cas, seule l’utilisation d’une sauvegarde incrémentielle ou pas, mais remontant à une date où l’on sait que le système n’a pas été infecté permettra de récupérer le système.
Pour des NAS de données, l’imagerie incrémentielle a généralement pour but de récupérer un fichier dans un état antérieur, fichier que l’on aura altéré suite à des erreurs de manipulations.

Je pense que le RAID5 pour fonctionner doit s’appuyer sur des contrôleurs de hautes qualités, c’est bien pour cette raison qu’il existe des cartes RAID professionnels très coûteuses.

Les chips intégrés des Freebox, des PC sont des contrôleur SATA très très très très bas de gamme
Les cartes contrôleurs de type LSI Megaraid, Adaptec... sont bien plus sophistiqués. Il y a des système de corrections d’erreur, certaines cartes embarquent une batteries lithium pour faire face à des pannes de courant et permettre le vidage du cache de données en toute sécurité.

Oui on voit sur certaines videos de datacenter Free un technicien, a priori kamikaze, qui “arrache” un disque dur d’une grappe en plein fonctionnement, et le reconnecte toujours à chaud.
Sauf que encore une fois, on parle de serveurs contenant du matos très haut de gamme, notamment au niveau des contrôleurs.

Mais je sais que ça ne servira à rien, beaucoup de geeks se prennent pour des pro et refusent de se remettre en question

J’ai récemment acquis sur ebay une carte LSI Megaraid à partir de laquelle je compte retester la solution du RAID5, soit via le RAID5 matériel de la carte, soit via un RAID5 logiciel (la carte se comportant comme simple contrôleur SATA) sous ZFS, un système de fichier hyper réputé en la matière car conçu dès son origine pour ce type d’usage.

A priori ça devrait beaucoup mieux marcher... même si encore une fois la récupération d’un RAID5 n’est jamais totalement garanti à 100%
Dans les datacenter, on se se repose pas que sur du RAID5, les serveurs sont aussi répliqués physiquement plusieurs fois.

Simon (SimR69)
lundi 5 juillet, 2021 08:23:33

Bonjour,

Merci pour votre réponse.

Adresse MAC du serveur : 34:27:92:60:D7:02

Le disque défectueux était un Toshiba MQ01ABD050, remplacé par un MQ01ABD050v.

Ils ne sont actuellement plus connectés sur le serveur, mais si besoin je peux les y rebrancher, et vous indiquer les numéros de série concernés.

bandit73 (bandit73)
mardi 10 août, 2021 21:38:06

J’ai connu la même mésaventure. Raid5 sur 4 disques identiques, un des disques passe à défectueux.
Le raid passe tout seul en inactif et impossible à redémarrer... changement par un disque de même taille mais aucune option de réparation ne s’active.
J’ai appelé la hotline qui m’a informé que la fonction NAS n’avait pas de support...
Finalement j’ai remis le disque défectueux qui est reparti, le raid s’est reconstruit.
J’ai pu sauver mes données sur un autre disque externe mais cela ne règle pas le problème si ça se reproduit...

Chargement...