Record linkage

record linkage, även känt som data matching eller entity resolution, är processen att identifiera poster som refererar till samma entitet över olika datakällor, särskilt när gemensamma identifierare saknas. Konceptet har en rik historia som sträcker sig tillbaka till Halbert L. Dunn 1946, med viktiga matematiska formaliseringar av Fellegi och Sunter 1969, vilka fortfarande utgör grunden för många tillämpningar. Moderna metoder för record linkage involverar datarensning (preprocessing) och avancerade tekniker som maskininlärning och neurala nätverk för att förbättra noggrannheten och automatisera processen. entity resolution är en specialiserad form av record linkage som använder komplexa regler och sannolikhetsbedömningar för att upptäcka matchningar och dolda relationer, ofta för att identifiera risker som bedrägerier eller intressekonflikter.