{"id":5679,"date":"2020-10-05T13:46:48","date_gmt":"2020-10-05T11:46:48","guid":{"rendered":"http:\/\/app.lib.uliege.be\/alma\/?page_id=5679"},"modified":"2020-10-21T15:50:28","modified_gmt":"2020-10-21T13:50:28","slug":"fusion-de-notices-cdi","status":"publish","type":"page","link":"https:\/\/services.lib.uliege.be\/alma\/primo-ve\/sources\/central-discovery-index\/fusion-de-notices-cdi\/","title":{"rendered":"Fusion de notices CDI"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\">Introduction<\/h2>\n\n\n\n<p>Le contenu du Central Discovery Index (CDI) provient de diff\u00e9rentes source, fournies par des \u00e9diteurs, d\u2019agr\u00e9gateurs de contenu, d\u2019archives ouvertes, etc. Au total, Ex Libris int\u00e8gre des contenus provenant de plus de 2 000 sources. Il arrive ainsi souvent qu\u2019il existe plus d\u2019une notice pour une r\u00e9f\u00e9rence donn\u00e9e, un article scientifique pouvant ainsi \u00eatre r\u00e9f\u00e9renc\u00e9 dans plusieurs sources). L&rsquo;affichage distinct de toutes ces notices peut s\u2019av\u00e9rer d\u00e9routant pour les utilisateurs.<\/p>\n\n\n\n<p>En outre, il y a aussi la volont\u00e9 de pr\u00e9senter \u00e0 l\u2019usager les m\u00e9tadonn\u00e9es les plus d\u00e9taill\u00e9es et les plus compl\u00e8tes et de la meilleure qualit\u00e9 possible. Aussi, afin d&rsquo;exploiter autant que possible les m\u00e9tadonn\u00e9es disponibles, tout en veillant \u00e0 minimiser les doublons et l&rsquo;ambigu\u00eft\u00e9 des r\u00e9sultats, Ex Libris utilise un processus appel\u00e9 <em>Match &amp; Merge<\/em>. <\/p>\n\n\n\n<p><em>Match &amp; Merge<\/em> est essentiellement un ensemble de crit\u00e8res qui contr\u00f4lent quelles notices (\u00ab\u00a0notices r\u00e9elles\u00a0\u00bb, notices telles que fournies par les fournisseurs) peuvent ou ne peuvent pas \u00eatre combin\u00e9es en notices composites que l\u2019on pourrait appeler \u00ab\u00a0notices logiques\u00a0\u00bb. Dans ces notices logiques, les m\u00e9tadonn\u00e9es disponibles \u00e0 partir des notices r\u00e9elles \u00e0 disposition sont synth\u00e9tis\u00e9es de telle sorte qu&rsquo;une seule notice enrichie et plus compl\u00e8te peut \u00eatre pr\u00e9sent\u00e9e \u00e0 l&rsquo;utilisateur.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"950\" height=\"587\" src=\"https:\/\/services.lib.uliege.be\/alma\/wp-content\/uploads\/2020\/10\/image-40.png\" alt=\"\" class=\"wp-image-5726\" srcset=\"https:\/\/services.lib.uliege.be\/alma\/wp-content\/uploads\/2020\/10\/image-40.png 950w, https:\/\/services.lib.uliege.be\/alma\/wp-content\/uploads\/2020\/10\/image-40-300x185.png 300w, https:\/\/services.lib.uliege.be\/alma\/wp-content\/uploads\/2020\/10\/image-40-768x475.png 768w\" sizes=\"auto, (max-width: 950px) 100vw, 950px\" \/><figcaption><em>Illustration du regroupement de notices r\u00e9elles, avec des m\u00e9tadonn\u00e9es diff\u00e9rentes, vers une notice logique enrichie<\/em><\/figcaption><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\">R\u00e8gles de fusion<\/h2>\n\n\n\n<p>Le processus de <em>Match &amp; Merge<\/em> se base sur diff\u00e9rents types d&rsquo;identifiants&nbsp;: si deux ou plusieurs notices partagent le m\u00eame identifiant, elles peuvent \u00eatre fusionn\u00e9es (d\u00e9doublonn\u00e9es) \u00e0 condition qu&rsquo;elles satisfassent \u00e0 d&rsquo;autres crit\u00e8res (en fonction de la nature de l\u2019identifiant). Si la plupart des types de contenu sont susceptibles d\u2019\u00eatre trait\u00e9s par le <em>Match &amp; Merge<\/em>, certains types en sont exclus dans certains cas et d\u2019autres totalement exclus (voir la section \u00ab\u00a0Filtres\u00a0\u00bb ci-dessous).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Sc\u00e9narios<\/h3>\n\n\n\n<p>Dans les exemples ci-dessous, l\u2019expression \u00ab\u00a0correspondance de titre floue\u00a0\u00bb (<em>fuzzy title match<\/em>) est une comparaison des champs combin\u00e9s <em>DocumentTitle <\/em>et <em>DocumentSubtitle <\/em>de deux notices, sans tenir compte de la casse, des espaces, de la ponctuation, des signes diacritiques et d&rsquo;autres caract\u00e8res sp\u00e9ciaux.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Identifiants externes&nbsp;:<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>DOI <\/strong>&#8211; n\u00e9cessite en plus une correspondance de titre floue&nbsp;; ne s&rsquo;applique pas au type <em>Journal<\/em><\/li><li><strong>PMID <\/strong>&#8211; n\u00e9cessite en plus une correspondance de titre floue&nbsp;; ne s&rsquo;applique pas au type <em>Journal<\/em><\/li><li><strong>ISBN \/ EISBN<\/strong> &#8211; n\u00e9cessite en plus une correspondance de titre floue&nbsp;; les ann\u00e9es de publication doivent \u00eatre espac\u00e9es de moins d&rsquo;un an<\/li><li><strong>ISSN \/ EISSN<\/strong> &#8211; <em>PublicationPlace <\/em>ou ann\u00e9e de publication doit \u00e9galement correspondre&nbsp;; s&rsquo;applique uniquement au type <em>Journal<\/em><\/li><li><strong>LCCN <\/strong>&#8211; pour le type <em>Journal<\/em>, <em>PublicationPlace <\/em>ou l&rsquo;ann\u00e9e de publication doivent \u00e9galement correspondre&nbsp;; pour les types <em>Book<\/em>, <em>Dissertation <\/em>et <em>Government Document<\/em>, une correspondance approximative du titre est requise et l&rsquo;ann\u00e9e de publication doit \u00e9galement correspondre<\/li><li><strong>OCLC <\/strong>&#8211; m\u00eames r\u00e8gles que pour le LCCN<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Identifiants internes&nbsp;:<\/h4>\n\n\n\n<p>Les notices avec un ISSN, EISSN, ISBN ou EISBN se voient attribuer un autre identifiant, interne \u00e0 Ex Libris, qui correspond au titre concern\u00e9. Le processus <em>Match &amp; Merge<\/em> se r\u00e9alise sur base de cet identifiant dans diff\u00e9rentes circonstances. Pour les notices de niveau sup\u00e9rieur (<em>titel-level<\/em>, <em>publication-level<\/em>), le processus se passe diff\u00e9remment&nbsp;:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><strong>Niveau Titre\/Publication<\/strong> : s&rsquo;applique aux types <em>Newspaper<\/em>, <em>Magazine<\/em>, <em>Journal<\/em> et <em>Book<\/em>. N\u00e9cessite uniquement la correspondance des identifiants au niveau du titre.<\/li><li><strong>Niveau Article<\/strong>&nbsp;: s&rsquo;applique aux types <em>Journal Article<\/em>, <em>Magazine Article<\/em>, <em>Newspaper Article<\/em>, <em>Trade Publication<\/em>, <em>Book Review<\/em> et <em>Conference Proceeding<\/em>. En plus de l&rsquo;identifiant au niveau du titre, le <em>DocumentTitle<\/em>, l&rsquo;ann\u00e9e de publication, le volume, le num\u00e9ro et la page de d\u00e9but doivent tous correspondre.<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Autres sc\u00e9narios<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Les notices relatives \u00e0 un document de type <em>Reference <\/em>(entr\u00e9es d&rsquo;encyclop\u00e9dies&#8230;) peuvent \u00eatre fusionn\u00e9es sur base uniquement d&rsquo;une correspondance de titre floue<\/li><li>Les notices de type <em>Dissertation <\/em>peuvent \u00eatre fusionn\u00e9es uniquement sur base d&rsquo;une URI (lien direct) dans les m\u00e9tadonn\u00e9es<\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Filtres<\/h2>\n\n\n\n<p>Les filtres fonctionnent essentiellement \u00e0 l&rsquo;inverse des r\u00e8gles&nbsp;: ils d\u00e9terminent les circonstances dans lesquelles les notices ne peuvent pas \u00eatre fusionn\u00e9es. Dans les cas o\u00f9 r\u00e8gles et filtres peuvent potentiellement \u00eatre appliqu\u00e9s, les filtres ont la pr\u00e9s\u00e9ance sur les r\u00e8gles.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">M\u00e9tadonn\u00e9es non concordantes<\/h4>\n\n\n\n<p>Si l&rsquo;un des \u00e9l\u00e9ments suivants ne correspond pas, les notices ne fusionneront pas :<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>DOI<\/li><li>PMID<\/li><li>URI (si les notices proviennent du m\u00eame jeu de contenu, du m\u00eame fournisseur)<\/li><li>Langue (peut \u00eatre affect\u00e9e par les sp\u00e9cifications de langue dans les m\u00e9tadonn\u00e9es source de la notice ou par la langue des m\u00e9tadonn\u00e9es de la notice d\u00e9tect\u00e9e par le syst\u00e8me)<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Types de notices CDI exclues<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Archival Material<\/li><li>Image<\/li><li>Microform<\/li><li>Music Recording<\/li><li>Patent<\/li><li>Report<\/li><li>Technical Report<\/li><li>Standard<\/li><li>Video Recording<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Autres filtres<\/h4>\n\n\n\n<ul class=\"wp-block-list\"><li>Les notices identifi\u00e9es comme provenant d&rsquo;une archive ouverte ne seront jamais fusionn\u00e9es.<\/li><li>Les notices de type Newspaper Article avec une date de publication ant\u00e9rieure au 1er janvier 2000 ne seront jamais fusionn\u00e9es.<\/li><li>Indicateur d&rsquo;exclusion : Ex Libris peut marquer des notices sp\u00e9cifiques afin de les exclure du processus Match &amp; Merge. Cela se fait g\u00e9n\u00e9ralement \u00e0 la demande expresse du fournisseur de contenu ou d\u2019une biblioth\u00e8que cliente.<\/li><li>\u00ab\u00a0Mauvais candidats\u00a0\u00bb&nbsp;: Ex Libris maintient en parall\u00e8le une liste interne de titres particuli\u00e8rement courts et g\u00e9n\u00e9riques qu\u2019ils ne souhaitent pas fusionner en raison de la forte probabilit\u00e9 d\u2019erreur qu\u2019une fusion engendrerait.<\/li><li>Surrepr\u00e9sentation&nbsp;: Toute notice ayant un titre qui appara\u00eet dans plus de 4000 notices dans CDI ne sera pas fusionn\u00e9e.<\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Fusion par alignement<\/h2>\n\n\n\n<p>Une \u00ab\u00a0fusion par alignement\u00a0\u00bb (<em>transitive merge<\/em>) est un sc\u00e9nario dans lequel trois notices ou plus sont fusionn\u00e9es et o\u00f9 au moins deux des notices ne pourraient pas fusionner de leur c\u00f4t\u00e9. Par exemple, dans le diagramme ci-dessous, la notice A peut fusionner avec la notice B et la notice B peut fusionner avec la notice C, mais la notice A ne serait par contre pas en mesure de fusionner avec la notice C. Gr\u00e2ce aux points communs que les notices A et C partagent avec la notice B, les trois notices r\u00e9elles peuvent \u00eatre fusionn\u00e9es dans une m\u00eame notice logique.<\/p>\n\n\n\n<div class=\"wp-block-image is-style-default\"><figure class=\"aligncenter\"><img decoding=\"async\" src=\"https:\/\/knowledge.exlibrisgroup.com\/@api\/deki\/files\/78008\/CDI_TransitiveMerge.png?revision=2\" alt=\"CDI_TransitiveMerge.png\"\/><figcaption><em>Illustration de la fusion par alignement<\/em><\/figcaption><\/figure><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Derni\u00e8res remarques<\/h2>\n\n\n\n<ul class=\"wp-block-list\"><li>Les notices des source locales (Alma, ORBi, MatheO, DONum&#8230;) ne peuvent <strong>pas <\/strong>fusionner avec des notices CDI.<\/li><li>Le processus <em>Match &amp; Merge<\/em> est neutre et ne favorise aucun fournisseur de donn\u00e9es (<em>vendor-neutral<\/em>).<\/li><li>Des notices de type diff\u00e9rent (ex. <em>Journal Article<\/em> et <em>Conference Proceeding<\/em>) peuvent \u00eatre fusionn\u00e9es si cela ne rentre pas en conflit avec les filtres applicables.<\/li><\/ul>\n\n\n\n<hr class=\"wp-block-separator\"\/>\n\n\n\n<p>Source : <strong><a rel=\"noreferrer noopener\" href=\"https:\/\/knowledge.exlibrisgroup.com\/Primo\/Content_Corner\/Central_Discovery_Index\/Documentation_and_Training\/010CDI_-_The_Central_Discovery_Index\/060Match_and_Merge_in_CDI\" target=\"_blank\">Match and Merge in CDI<\/a><\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Introduction Le contenu du Central Discovery Index (CDI) provient de diff\u00e9rentes source, fournies par des \u00e9diteurs, d\u2019agr\u00e9gateurs de contenu, d\u2019archives ouvertes, etc. Au total, Ex Libris int\u00e8gre des contenus provenant de plus de 2 000 sources. Il arrive ainsi souvent qu\u2019il existe plus d\u2019une notice pour une r\u00e9f\u00e9rence donn\u00e9e, un&#8230; <a href=\"https:\/\/services.lib.uliege.be\/alma\/primo-ve\/sources\/central-discovery-index\/fusion-de-notices-cdi\/\" class=\"readmore\">Lire l&#039;int\u00e9gralit\u00e9&#8230;<span class=\"screen-reader-text\">Fusion de notices CDI<\/span><span class=\"fa fa-angle-double-right\" aria-hidden=\"true\"><\/span><\/a><\/p>\n","protected":false},"author":5,"featured_media":0,"parent":5474,"menu_order":2,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-5679","page","type-page","status-publish","hentry"],"jetpack_sharing_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/P7rJUv-1tB","_links":{"self":[{"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/pages\/5679","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/comments?post=5679"}],"version-history":[{"count":16,"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/pages\/5679\/revisions"}],"predecessor-version":[{"id":5761,"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/pages\/5679\/revisions\/5761"}],"up":[{"embeddable":true,"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/pages\/5474"}],"wp:attachment":[{"href":"https:\/\/services.lib.uliege.be\/alma\/wp-json\/wp\/v2\/media?parent=5679"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}