la famille Marc

les métadonnées des bibliothécaires

olivier roumieux - avril 2001 (Archimag)

Le format Marc a été le fer de lance des bibliothécaires pour transformer l'ordinateur en aide-bibliothécaire. Codifié et donc peu lisible par l'homme, ce format permet d'échanger et de traiter l'information bibliographique entre systèmes.

A l'heure où tout un chacun croit bon de dénoncer l'entropie informationnelle du Web, il convient de rappeler qu'une profession réfléchit à la question de l'organisation et de l'accès des documents depuis près de quarante ans. Les bibliothécaires ont en effet élaboré le format Marc (Machine readable cataloguing - catalogage lisible par l'ordinateur) pour normaliser la description des documents et ainsi faciliter l'échange et l'exploitation de ces descriptions au travers des réseaux d'ordinateurs. Les premiers travaux sont dus à la Bibliothèque du Congrès, au milieu des années soixante, qui définit le premier format Marc, que l'on appela par la suite le LCMarc (Library of Congress) ou USMarc. Le terme de "format" est défini comme un " agencement structuré d'un support de données " (Journal Officiel du 19 février 1984). Il est donc indissociable du formalisme structurel promu par le développement de l'informatique. Le format Marc doit être considéré comme une transcription informatique de l'ISBD (International standard bibliographic description), l'ensemble de recommandations visant à normaliser la rédaction manuelle de notices bibliographiques. Ce qui par contrecoup en fait un format très difficilement lisible par l'être humain.

une cinquantaine de Marc

Le mieux étant souvent l'ennemi du bien, d'autres formats Marc voient le jour dans les années soixante-dix, développés par les principales agences bibliographiques nationales. Nous ne résistons pas au plaisir d'énumérer quelques-uns de ces formats nationaux (on en compterait aujourd'hui une cinquantaine) : Samarc (Afrique du Sud), Marcal (Amérique du Sud), Ausmarc (Australie), Canmarc (Canada), Danmarc (Danemark), Finmarc (Finlande), Thaimarc (Thaïlande), jusqu'à la Catalogne qui dispose de son Catmarc ! La Bibliothèque nationale, en France, met au point son propre format en 1974, l'Intermarc, toujours en vigueur à la BNF, mais très peu adopté par les autres bibliothèques françaises.
L'Iso (International organization for standardization) se décide à mettre un peu d'ordre dans cette "débauche de normalisations" en élaborant une norme internationale structurante pour l'échange de données bibliographiques, l'Iso 2709. Adopter un logiciel de gestion de bibliothèques ayant implémenté cette norme est un gage d'ouverture pour ses données.
L'Ifla (International federation of library associations and institutions), dans le cadre de son programme UBC (Universal bibliographic control), publie en 1977 les spécifications du format Unimarc. Ce dernier doit permettre l'échange bilatéral entre tous les types de formats Marc existants. Son utilisation en tant que format d'échange est encouragée en France par un décret de 1993. Aujourd'hui, la majorité des éditeurs de logiciels spécialisés présente le catalogage dans un format Marc (principalement USmarc ou Intermarc selon l'origine) et propose l'exportation et l'importation de notices au format Unimarc.

métadonnées plus généralistes

L'explosion des ressources documentaires disponibles sur l'Internet remet bien évidemment en cause le contexte traditionnel du document. Le nouveau champ 856 inclus dans le schéma Marc permet d'ajouter aux notices bibliographiques un lien vers la ressource électronique correspondante.
Mais les plus importants projets actuels tendent à incorporer les données descriptives - qu'il est de bon ton d'appeler désormais métadonnées - dans le corps même du document. Des formats de métadonnées plus généralistes, comme le Dublin Core, visent, par leur syntaxe modulaire, à prendre en compte les différents standards de description. Le XML (eXtended markup language), en digne successeur du SGML (Standard generalized markup language), est le format de structuration le mieux adapté pour implémenter les métadonnées dans les gigantesques gisements de documents actuels et à venir. En ce sens, il est clair que le format Marc, fortement marqué par l' " Ordre des livres " (l'expression est de Roger Chartier (1)), cède le pas aux nouvelles métadonnées, mieux à même de décrire l'information contenue sur des supports en constante mutation.

(1) Directeur d'étude à l'Ecole des hautes études en sciences sociales

Unimarc : brève anatomie

Le format Unimarc se compose d'un label, ou en-tête, d'un répertoire et de champs. Le label, codé sur 24 caractères, indique la longueur de la notice, son statut (nouvelle, corrigée, complétée), le type de publication, le type de document et le degré d'utilisation des règles de l'ISBD dans la rédaction de cette notice. Le répertoire est généré automatiquement par le système à partir des champs renseignés et sert aux échanges de données.
On dénombre 999 zones ou champs regroupés en 10 blocs adaptés du format ISBD. Toutes les zones ne sont évidemment pas utilisées pour chaque notice, certains champs ne sont même jamais pris en compte par certains systèmes, suivant la politique de catalogage adoptée. Certaines zones sont obligatoires, d'autres générées automatiquement par le système et enfin certaines zones sont répétables (pour les vedettes auteurs notamment). Chaque zone est composée d'une étiquette numérique sur 3 chiffres, d'indicateurs qui qualifient la zone qui suit, puis la zone de données proprement dite. La plupart des logiciels de gestion de bibliothèques adaptent le format Marc dans leur interface, afin de le rendre plus convivial, notamment en remplaçant les codes de zones par des intitulés en clair. Certains catalogueurs puristes préfèrent néanmoins travailler à même la grille native du format.

Bloc 0 : numéros d'identification des documents
Dans ce bloc sont entrées des informations telles que l'ISBN ou l'ISSN.

Bloc 1 : informations codées
Ces données servent aux tris et aux extractions de produits documentaires.

Bloc 2 : informations descriptives
C'est dans ce bloc que s'effectue le catalogage proprement dit, selon les différentes zones de l'ISBD.

Bloc 3 : notes
Texte libre complémentaire au bloc précédent.

Bloc 4 : liens avec d'autres notices
Par exemple entre la notice d'un ouvrage et celle de la collection à laquelle appartient l'ouvrage.

Bloc 5 : titres associés
Tous les autres titres autres ???que le titre propre : titre original, de couverture, parallèle…

Bloc 6 : indexation matière
L'emplacement des vedettes matières pour l'indexation du document.

Bloc 7 : responsabilité intellectuelle
L'emplacement des vedettes auteurs : toute personne physique ou morale qui a pris une responsabilité dans la création du document.

Bloc 8 : données internationales
La source de la notice (créateur ou diffuseur) est indiquée ici.

Bloc 9 : données locales
Ce bloc n'est pas forcément rempli quand le format Unimarc ne sert qu'à l'échange de notices. Quand Unimarc est utilisé pour le traitement local, les informations de localisation - la cote - et d'exemplaires sont indiquées ici.

Exemple d'un ouvrage catalogué par la BNF

Dieng Sarr, Aïssatou
Le |langage-expression orale, mode d'emploi : pédagogie du langage à l'école maternelle et dans les petites classes de l'école élémentaire : à l'usage des éducateurs préscolaires, des enseignants et des élèves-maîtres / Aïssatou Dieng-Sarr,... Chérif Tall,... Fatou Diop,....[Paris] : Agence intergouvernementale de la francophonie ; Versailles : les Classiques africains, 1999 (55-Bar-le-Duc : Impr. Saint-Paul). - 115 p. : ill., couv. ill. ; 24 cm. - (Pédagogie pratique)
Bibliogr., 2 p.. - ISBN 2-85049-834-3 (br.).
Communication orale -- Étude et enseignement (préscolaire) -- Afrique noire
-- Guides, manuels, etc.
Communication orale -- Étude et enseignement (primaire) -- Afrique noire --
Guides, manuels, etc.
Tall, Chérif. 00 Diop, Fatou. 00

001 [ ] frBN025259676
008 [ ] 000403s1999 fr a 0 8 freb 1 01 37
015 [ ] $a00107528
020 [ ] $a 2-85049-834-3 $b br.
100 [01416553] <$w.0..b.....$a Dieng Sarr $m Aïssatou>
245 [ ] 1 $a Le |langage-expression orale, mode d'emploi $e
pédagogie
du langage à l'école maternelle et dans les petites
classes de
l'école élémentaire $e à l'usage des éducateurs
préscolaires,
des enseignants et des élèves-maîtres $f Aïssatou
Dieng-Sarr,... Chérif Tall,... Fatou Diop,...
260 [ ] $a [Paris] $c Agence intergouvernementale de la
francophonie
$a Versailles $c les Classiques africains $d 1999
270 [ ] $a 55-Bar-le-Duc $c Impr. Saint-Paul
280 [ ] $a 115 p. $c ill., couv. ill. $d 24 cm
295 [02409597] 10$a Pédagogie pratique
300 [ ] $a Bibliogr., 2 p.
410 [02409597] $d 1999
600 [ ] 6 [00152493]<$a Communication orale>[00211892]<$x Étude et
enseignement $g préscolaire>[00151366]<$y Afrique
noire>[00211908]<$x Guides, manuels, etc.>
600 [ ] 6 [00152493]<$a Communication orale>[00211986]<$x Étude et
enseignement $g primaire>[00151366]<$y Afrique
noire>[00211908]<$x Guides, manuels, etc.>
700 [00037435] <$w 0 b $a Tall $m Chérif>$400
700 [01416554] <$w.0..b.....$a Diop $m Fatou>$400
suite de l'exemple?

pour en savoir +

Unimarc : manuel de catalogage / Marie-Renée Cazabon. - Paris : Ed. du Cercle de la librairie, 1999.
Cataloguer : mode d'emploi : initiation aux techniques du catalogage / Michelle Pastor (coord.). - Paris : ABF, 1997.
Le catalogage : méthode et pratiques / Isabelle Dussert-Carbone, Marie-Renée Cazabon. - Paris : Ed. du Cercle de la librairie, 1994.

+loin sur l'Internet

Format Unimarc bibliographique abrégé
www.bnf.fr/ftp/formats/unimarc.rtf
Ifla Universal Bibliographic Control and International Marc Core Programme (UBCIM)
ifla.inist.fr/VI/3/ubcim.htm

- Olivier Roumieux, page créée le 1er juillet 2001 -

Valid HTML 4.01! Valid CSS!