Re(7): Adressdublettenprüfung
Geizhals » Forum » Programmierung » Adressdublettenprüfung (38 Beiträge, 629 Mal gelesen) Top-100 | Fresh-100
Du bist nicht angemeldet. [ Login/Registrieren ]
.  Re: Adressdublettenprüfung  (Robert Craven am 13.11.2009, 18:12:06)
..  Re(2): Adressdublettenprüfung  (Hawelka am 13.11.2009, 19:37:28)
...  Re(3): Adressdublettenprüfung  (hellbringer am 14.11.2009, 12:19:37)
....  Re(4): Adressdublettenprüfung  (Hawelka am 14.11.2009, 12:42:44)
.  Re: Adressdublettenprüfung  (Paulas_Papa am 13.11.2009, 22:31:42)
..  Re(2): Adressdublettenprüfung  (Hawelka am 13.11.2009, 22:50:51)
...  Re(3): Adressdublettenprüfung  (Paulas_Papa am 14.11.2009, 23:42:01)
....  Re(4): Adressdublettenprüfung  (Hawelka am 15.11.2009, 13:52:51)
...  Re(3): Adressdublettenprüfung  (ruprecht69 am 15.11.2009, 01:35:01)
.  Re: Adressdublettenprüfung  (Capt.Nemo am 13.11.2009, 23:45:56)
..  Re(2): Adressdublettenprüfung  (Hawelka am 14.11.2009, 00:25:48)
...  Re(3): Adressdublettenprüfung  (Capt.Nemo am 14.11.2009, 00:58:56)
....  Re(4): Adressdublettenprüfung  (Hawelka am 14.11.2009, 11:17:04)
.....  Re(5): Adressdublettenprüfung  (-Transformer2K- am 14.11.2009, 11:29:51)
......  Re(6): Adressdublettenprüfung  (Hawelka am 14.11.2009, 11:34:16)
.......  Re(7): Adressdublettenprüfung  (-Transformer2K- am 14.11.2009, 11:36:32)
........  Re(8): Adressdublettenprüfung  (Hawelka am 14.11.2009, 11:38:47)
.........  Re(9): Adressdublettenprüfung  (-Transformer2K- am 14.11.2009, 12:55:31)
.....  Re(5): Adressdublettenprüfung  (Capt.Nemo am 14.11.2009, 12:13:58)
......  Re(6): Adressdublettenprüfung  (Hawelka am 14.11.2009, 12:41:42)
.......
Re(7): Adressdublettenprüfung
14.11.2009, 13:30:33
Also, dies möchte ich bezweifeln. Hast du dir den Algorithmus schon mal näher angesehen?

Nein, wir verwenden das Programm nur, wir entwickeln es nicht :)

Das würde mir aber nicht viel helfen, da ich ja nicht weiß, welche Methode(n) hier tatsächlich angewendet werden.

War auch nur als Beispiel gedacht, um dir zu zeigen wie Leistungsfähig unscharfe Suche ist (Trefferquote und Geschwindigkeit).

Ja - schon klar, ich wollte damit darstellen, dass überflüssige Begriffe einfach das Ergebnis negativ beeinflussen.

Ja tun sie. Ein paar kann man wegfiltern, aber verschwende nicht zu viel Energie damit. Vor allem, wenn wie du sagst, die Felder nichtmal richtig ausgefüllt werden(!)

Aber die Fuzzy-Suche und ein vorgelagerter Filter schließen sich ja auch nicht aus.

Nein tun sie nicht, siehe oben. Aber ich sage dir aus Erfahrung: Verschwende nicht zu viel Energie damit, du glaubst nicht was es alles für Gemeinsamkeiten gibt, die dann doch keine identen Datensätze sind.


Meine Empfehlung für das Projekt (beruht auf einmaliger Erfahrung, da wir eine minimal größere DB entrümpelt habe):
* Säuberung der DB. Ich weiß, da sind 1 bis 2 Mannjahre nötig (eventuell extern vergeben), aber Adressen sind idR Kapital und das sollte dem MD klar sein.
* Regeln und deren konsequente Umsetzung und Kontrolle bei der Neuanlage oder Änderung von Datensätzen (Schulung der MA die im CRM Ändern dürfen).

Und dann kann dein Programm greifen. Wenn die Daten mal halbwegs strukturiert sind, dann ist eine gut eingestellte unscharfe Suche bei kleineren Tipp- und Eingabefehlern zu 100% treffsicher und liefert nur sehr wenige zufällige Ähnlichkeiten.

Und nochwas: Ein Herr Maier muß kein Meier sein, ein KR G. Huber muß nicht gleich einem Dr. G. Huber sein usw. Bei 20.000 Datensätzen wäre ich mit den von dir vorgeschlagenen Vereinfachungen schon sehr vorsichtig.

Und wie gesagt: Die Geschwindigkeit passt. Außerdem ist es sicher kein Problem, wenn nach dem Button "Speichern" das CRM mal für eine Sekunde eine Gedankenpause macht um die Ähnlichkeiten zu den bereits in der DB angelegten Datensätzen zu berechnen - muß ja nicht live während der Eingabe passieren.

Antworten PM Alle Chronologisch Zum Vorgänger
 
Melden nicht möglich
.  Re: Adressdublettenprüfung  (-Transformer2K- am 14.11.2009, 10:37:09)
..  Re(2): Adressdublettenprüfung  (Hawelka am 14.11.2009, 11:18:40)
...  Re(3): Adressdublettenprüfung  (-Transformer2K- am 14.11.2009, 11:28:26)
....  Re(4): Adressdublettenprüfung  (Hawelka am 14.11.2009, 11:31:19)
.....  Re(5): Adressdublettenprüfung  (-Transformer2K- am 14.11.2009, 11:31:47)
.  Re: Adressdublettenprüfung  (j. am 17.11.2009, 15:43:50)
..  Re(2): Adressdublettenprüfung  (Xane am 18.11.2009, 01:51:44)
...  Re(3): Adressdublettenprüfung  (Hawelka am 18.11.2009, 16:51:24)
.  Re: Adressdublettenprüfung  (shodan am 18.11.2009, 14:00:01)
..  Re(2): Adressdublettenprüfung  (Hawelka am 18.11.2009, 17:01:36)
.  Re: Adressdublettenprüfung  (dasistmeinnick11+ am 19.11.2009, 13:35:44)
 

Dieses Forum ist eine frei zugängliche Diskussionsplattform.
Der Betreiber übernimmt keine Verantwortung für den Inhalt der Beiträge und behält sich das Recht vor, Beiträge mit rechtswidrigem oder anstößigem Inhalt zu löschen.
Datenschutzerklärung