22

Das unangenehme Gespräch: Das gehört Ihnen zweimal

Wie Duplikaterkennung funktioniert, worauf sie abgleicht, wie Massenbereinigung hilft und was Ihre Kaufgewohnheiten darüber verraten.

4 Min.

Wie die Duplikaterkennung funktioniert, wie man bereinigt und warum es den Besten von uns passiert.


Es passiert jedem

Sie haben auf einer Messe ein Buch gekauft. Sie bringen es nach Hause. Sie stellen es ins Regal. Sechs Monate später kaufen Sie dasselbe Buch auf einer anderen Messe noch einmal. Sie bringen es nach Hause. Sie stellen es in ein anderes Regal. Und jetzt besitzen Sie zwei Exemplare von The Anatomy of Melancholy und null Exemplare jener Selbsterkenntnis, die nötig gewesen wäre, um es zu bemerken.

Das ist kein Charakterfehler. Es besteht Sammelgefahr. Wenn Ihre Bibliothek mehr als ein paar hundert Bände umfasst, wird Ihr Gedächtnis zu einem unzuverlässigen Erzähler. Die Duplikaterkennung von Shelvd existiert, weil Ihr Gehirn Sie verrät und Ihr Geldbeutel den Preis nicht zweimal zahlen sollte.


Wie es funktioniert

Shelvd prüft mit serverseitigem SQL auf Duplikate – kein vager Ähnlichkeitswert, sondern exakte Übereinstimmung bei Bezeichnern und Titeln. Das System führt drei Prüfungen durch:

ISBN-13 Übereinstimmung

Wenn zwei Bücher denselben ISBN-13 verwenden, handelt es sich um dieselbe Ausgabe. Dies ist die zuverlässigste Übereinstimmung. Ein ISBN-13 identifiziert eine bestimmte Ausgabe eines bestimmten Herausgebers. Wenn Sie zwei Einträge mit demselben Eintrag haben, ist einer davon überflüssig – es sei denn, Sie wollten tatsächlich zwei physische Kopien katalogisieren.

ISBN-10 Übereinstimmung

Gleiches Prinzip, älteres Format. Bücher, die vor 2007 veröffentlicht wurden, dürfen einen ISBN-10, aber keine ISBN-13 haben. Shelvd gleicht diese separat ab, da die Konvertierung nicht immer vorhanden ist.

Genaue Titelübereinstimmung

Wenn zwei Bücher genau den gleichen Titel haben (Groß-/Kleinschreibung beachten), werden sie von Shelvd gekennzeichnet. Dadurch werden Duplikate erfasst, bei denen keine ISBNs eingegeben wurden – was bei antiquarischen Büchern häufig vorkommt. Es kommt zu einigen Fehlalarmen: Möglicherweise besitzen Sie zwei verschiedene Ausgaben von Hamlet. Das ist in Ordnung. Die Systemflags; Sie entscheiden.


Die Seite „Duplikate“.

Navigieren Sie zu Bücher → Duplikate, um Ihre gruppierten Ergebnisse anzuzeigen.

Jede Gruppe zeigt die übereinstimmenden Bücher mit ihren wichtigsten Details: Titel, Autor, Jahr, ISBN und Zustand. Bücher werden nach Übereinstimmungstyp gruppiert, sodass Sie sehen können, warum Shelvd denkt, dass es sich um Duplikate handelt.

Was Sie tun können

  • Erweitern Sie eine Gruppe, um die vollständigen Details jedes Spiels anzuzeigen
  • Wählen Sie einzelne Bücher aus, um sie zum Löschen zu markieren
  • Alle in einer Gruppe auswählen mit einem Klick
  • Massenlöschung ausgewählter Duplikate

Das System löscht niemals automatisch. Es flackert. Sie bewerten. Sie entscheiden. Denn manchmal besitzt man tatsächlich zwei Exemplare desselben Buches – eines zum Lesen und eines für das Regal. Wir urteilen nicht. Viel.


Duplikate verhindern

Das beste Duplikat ist das, das nie passiert.

  • Geben Sie immer ISBNs ein, sofern verfügbar. Sie sind das stärkste Spielsignal.
  • Verwenden Sie Library Lookup anstelle der manuellen Eingabe – es werden standardisierte Daten abgerufen, die leichter abzugleichen sind.
  • Vor dem Hinzufügen suchen – verwenden Sie die globale Suche, um zu überprüfen, ob Sie bereits einen Titel haben.

Wenn Sie aus einer Tabellenkalkulation importieren, sind Duplikate fast unvermeidlich. Führen Sie nach jedem Import die Duplikatprüfung durch. Betrachten Sie es als das bibliografische Äquivalent zum Überprüfen Ihrer Taschen vor dem Wäschewaschen.


Ein Hinweis zu Fehlalarmen

Durch die Titelübereinstimmung werden Bücher mit identischen Titeln gekennzeichnet, bei denen es sich um wirklich unterschiedliche Werke handelt – unterschiedliche Autoren, unterschiedliche Jahrhunderte, alles andere. Metamorphosen von Ovid und Metamorphosen von Kafka sind nicht dasselbe Buch. Das System weiß, dass sich das offensichtlich anfühlt. Aber Computer sind buchstäbliche Geschöpfe und Titel sind keine eindeutigen Identifikatoren.

Überprüfen Sie die Gruppen. Behalten Sie das Besondere. Löschen Sie die Duplikate. Ihre Regale (und Ihr Budget) werden es Ihnen danken.


Siehe auch: Identifikatoren · Import & Export · Ihr erstes Buch

Das unangenehme Gespräch: Das gehört Ihnen zweimal — Shelvd