Université Pierre et Marie Curie

Systèmes d'exploitation des ordinateurs

Chapitre 1. Les systèmes d'exploitation
Chapitre 2. Mécanismes d'exécution et de communication
Chapitre 3. Gestion des activités parallèles
Chapitre 4. Gestion des fichiers
4.1. Principes de la gestion de l'information
4.2. Systèmes de fichiers
4.3. Organisation sur un support physique
4.3.1. Structure d'un disque
4.3.2. Organisation logique sur un support magnétique
4.4. Système de fichiers sous Unix
4.5. Fonctions d'accès élémentaires
Chapitre 5. Partage des ressources
Chapitre 6. Au-dessus du système d'exploitation
Chapitre 7. Notions sur les communications
Chapitre 8. Notions sur la sécurité
Bibliographie
Chapitre 9. Exercices et TPs
Examens
Page d'accueilTable des matièresNiveau supérieurPage précédenteBas de la pagePage suivante

4.3.1. Structure d'un disque

Le quantum lu ou écrit n'est pas l'octet mais le secteur. Windows utilise par défaut des secteurs de 256 octets, Unix de 512 à 4096 octets suivant les systèmes. La raison en est que la préparation d'un transfert, entre disque et mémoire, est onéreuse et demande plusieurs cycles de temps du processeur. Le choix de la taille du secteur résulte d'un compromis entre temps de transfert et de préparation. Plus le canal de transfert est efficace, plus grand est le secteur: ainsi sur un Cray il est de 4096 octets car les dispositifs d'entrées-sorties sont très rapides.

Structure d'un disque

Les disques modernes comportent au minimum deux faces. Ils peuvent être constitués de plusieurs plateaux tournant sur le même axe (fig. 4.10). Sur une face d'un plateau on peut accéder à toute l'information rangée sur une circonférence sans devoir déplacer la tête de lecture. Ce groupe s'appelle une piste. Elle est accédé plus rapidement que des secteurs dispersés au hasard puisqu'il suffit d'attendre une rotation (la vitesses est en général de 5000 à 10 000tours par minute) pour lire ou écrire son contenu. Les disquettes Windows de diamètre 3 1/2", formattées à 1,4 Moctets comprennent ainsi 80 pistes par face, chacune contenant 18 secteurs. Il existe une tête de lecture par face. Toutes les têtes sont solidaires donc toutes les pistes de même diamètre sont accessibles simultanément. C'est pourquoi il existe un troisième niveau d'organisation qui est le cylindre. Il est constitué de l'ensemble des pistes de même diamètre accessibles simultanément. Sur une disquette le cylindre est constitué de deux pistes. Dans les disques de très grande capacité une face sert souvent uniquement à l'asservissement du déplacement du bras qui porte les têtes.

schéma d'un disque
Figure 4.10 - Schéma d'un disque

Formatter un disque revient à créer les secteurs sur le support magnétique vierge. On écrit puis on lit chaque secteur. S'il s'avère défectueux son adresse est inscrite dans un emplacement réservé. Si le nombre de secteurs défectueux dépasse la taille de cette table, le formattage échoue et le disque est déclaré inutilisable. Il ne reste plus qu'à le changer. Un disque neuf doit être livré avec une fiche indiquant la liste des zones qui ont été trouvées mauvaises à la vérification. Il est en effet impossible de garantir qu'il n'y a pas d'erreurs dans un support à très haute densité, aussi doit-on exiger ce contrôle du fabriquant. Lorsqu'on a besoin d'espace pour créer ou étendre un fichier, le système avant toute réservation, vérifie que les secteurs alloués ne sont pas inscrits dans la table. Si des messages d'erreur apparaissent lors d'opérations d'écriture certains systèmes sont capables d'ajouter immédiatement les adresses des secteurs erronés à la liste de ceux qui sont défectueux et réparent ainsi le disque. Des utilitaires de vérification peuvent également le faire mais l'information qui aurait été précédemment inscrite dans ces positions est perdue.

Notons que le formattage est la seule opération qui efface complètement le contenu d'un disque puisque, dans l'opération de vérification, chaque secteur est initialisé. Comme ceci est long, il faut compter plusieurs heures pour formatter un disque de 80 Goctets, certains utilitaires permettent un formattage rapide en supprimant l'opération d'écriture-lecture de vérification. Ceci est extrêmement dangereux car une information inscrite dans un secteur défectueux est illisible et peut conduire à la perte de l'ensemble du fichier.

La rapidité du transfert des informations est fortement pénalisée par les mouvements mécaniques : temps nécessaire au déplacement des têtes de lecture et à la rotation pour amener l'information en-dessous. C'est pourquoi les les secteurs successifs sont rangés par piste et par cylindre. Pour améliorer les performances on peut réserver à l'avance un espace contigu de façon à minimiser le temsp de transfert. C'est ce qui est fait pour les fichiers les plus critiques d'un système d'exploitation. Nous verrons dans la section suivante que l'organisation logique des fichiers fait que ceci est difficile à réaliser à moins d'estimer à l'avance la taille maximale du fichier, ce qui conduit à des gaspillages d'espace.

Sécurisation des données : RAID

La destruction de tout ou partie d'un disque entraine des conséquences catastrophiques pour la continuité du service :

  1. nécessité de disposer de sauvegardes récentes (voir chapitre 6)
  2. temps nécessaire au remplacement et à la reconstruction des informations.

En bref cela peut demander des heures, voire des jours entiers, ce qui est impossible dans de nombreux contextes.

Les solutions possibles n'étaient envisageables, jusqu'à ces dernières années, que pour des serveurs de haut de gamme dont le coût d'achat n'est pas le facteur le plus important. Depuis quelques années ces solutions se sont démocratisées et sont à la portée de n'importe quelle entreprise, voire d'un particulier. RAID (Redundant Array of Independant Drives) est la solution la plus employée.

Le principe consiste à multiplier le nombre de disques employés en parallèle et à distribuer l'information sur toutes les surfaces en assurant une redondance. Ainsi si un disque tombe en panne il sera possible de continuer et de remplacer puis de reconstruire le disque défectueux sans arrêt du service. On distingue six niveau en fonction de la qualité de service demandée.

RAID 0

Ce n'est pas vraiment un système sécurisé. L'ensemble des disques est vu comme un énorme disque virtuel unique. Les données sont distribuées, sans redondance, sur les différents disques. Si l'un d'eux tombe en panne elles sont perdues mais le reste du système n'est pas affecté. En contre partie le débit est élevé car on transfert les blocs d'information en parallèle sur toutes les surfaces. Ceci est employé lorsque la sécurité n'est pas critique mais que l'on veut une grande efficacité.

RAID 1 ou mirroring

Dans ce système les mêmes informations sont transférées simultanément sur deux disques qui sont donc des miroirs l'un de l'autre. Les chances que les deux tombenet en panne simultanément sont extrèmement faibles. Ce système est donc très sur mais la moitié de la capacité seulement est utilisable.

RAID 0+1

C'est la combinaison de RAID 0 et RAID 1. Il faut donc au minimum quatre disques. On combine rapidité de transfert et sécurité.

RAID 3

Il faut au minimum trois disques. Les données sont réparties successivement sur les disques 1 et 2. Le troisème sert à stocker le résultat d'un calcul de parité qui permet de reconstruire automatiquement l'information en cas de panne des deux premiers disques. On perd un tiers de la capacité pour le contrôle de parité.

RAID 5

Dans cette configuration les blocs de parité sont distribués sur les différents disques de telle façon que si un disque tombe en panne l'information puisse être rétablie. Habituellement on garde un disque prêt en attente dans l'armoire. En cas de panne l'information est immédiatement rétablie gràce aux blocs de parité et, simultanément le disque en panne est reconstruit sur le disque de réserve, sans arrêt de service. Il suffit d'enlever le disque défectueux et de le remplacer par un disque neuf pour rétablir le système dans toute sa fonctionnalité. Bien entendu le système est ralenti pendant la phase de reconstruction mais le fonctionnement n'est jamais interrompu. C'est probablement la solution la plus employée.

Structure dune bande magnétique

Ce support est tombé en désuétude pour les machines individuelles. Néanmoins les centres de calcul continuent à les employer, pour les sauvegardes notamment; La capacité d'une bande moderne varie de 100 Go à 400 Go et la possibilité de changer le support chargé dans le lecteur étend sa capacité.

Une bande magnétique, quelque soit son conditionnement, ne possède pas de structure. Les informations sont écrites par blocs séquentiels (fig. 4.11). Leur longueur peut souvent être choisie afin d'obtenir le meilleur compromis entre les temps de préparation et de transfert de l'information. La relation entre les adresses physique et logique est donc simple puisqu'un fichier ne peut être constitué que de blocs contigus. On inscrit au début, avant de transférer le contenu, son nom, sa date de création et d'autres informations pertinentes. A la fin du dernier bloc une marque spéciale EOF (end of file) indique la fin du fichier. Plusieurs fichiers peuvent être rangés les uns derrière les autres.

structure d'une bande magnétique

Figure 4.11 - Organisation d'une bande magnétique

Retrouver une information sur une bande est donc long puisqu'il faut la parcourir jusqu'à retrouver le header du fichier qu'on recherche. Cela peut demander plusieurs heures !


Copyright Yves Epelboin, université P.M. Curie, 2000, MAJ 15 mars, 2006

Page d'accueilTable des matièresNiveau supérieurPage précédenteHaut de la pagePage suivante