GENERALI Seguros ha llevado a cabo un ambicioso proyecto de mejora de la Calidad de los Datos de sus clientes de la mano de la multinacional española DEYDE Calidad de Datos. Este proyecto se llevó a cabo con el sistema MyDataQ, la solución de Calidad de Datos de DEYDE. En una primera fase, se trataron y corrigieron los datos de los tomadores activos contenidos en las bases de datos de GENERALI Seguros.
Para el tratamiento de las direcciones se utilizó el módulo MyDataQ_Addresses, que permite separar los elementos que forman la dirección (tipo de vía, nombre, número, complementos, código postal y población), corregir el nombre de la población y de la vía, asignar el código postal correcto y actualizado, según Correos, asignar un indicador de fiabilidad para envíos postales y marcar las direcciones ilocalizables.
Los nombres se trataron con el módulo MyDataQ_Names, que permite diferenciar personas físicas de entidades jurídicas, separar nombre y apellido en las personas físicas, asignar género de acuerdo al nombre, corregir errores frecuentes y marcar nombres no identificables.
En el tratamiento de los números de teléfono, se utilizó el módulo MyDataQ_Phones, encargado de eliminar los caracteres no numéricos en el campo teléfono, asignar prefijo telefónico y validar el número resultante.
También en esta fase, se ejecutaron procesos de localización de clientes duplicados, utilizando el módulo MyDataQ_Dedupe, que permite marcar los registros duplicados existentes en la base de datos tratada, obteniendo así una visión única del cliente. En línea con el proceso anterior, y con el fin de detectar hogares donde GENERALI cuenta con más de un cliente, se utilizó el módulo MyDataQ_Homes.
Y por último para el enriquecimiento de la dirección postal de los clientes de GENERALI con información como la sección censal a la que pertenecen, sus coordenadas geográficas o su tipología como consumidor, se utilizó el módulo MyDataQ_Geo.
En esta primera fase, donde se trataron dos millones de registros, DEYDE realiza el tratamiento de la totalidad de los datos con una periodicidad mensual con el fin de procesar tanto las altas generadas durante el mes como los datos históricos ya tratados anteriormente, con el fin de mantenerlos actualizados. El primer proceso de esta primera fase, supuso algo más de un mes de trabajo ya que junto a los procesos automáticos se realizaron revisiones manuales con el fin de obtener los mejores resultados. Los procesos mensuales siguientes tienen una duración de solamente tres días, haciendo que el tratamiento sea ágil y con un mínimo impacto para GENERALI Seguros.
La segunda fase del proyecto, que incluye el tratamiento del resto de figuras contenidas en su data warehouse (asegurados, beneficiarios, prospects, etc.), ha contemplado también las fases de tratamiento de direcciones y depuración de nombres aunque se ha centrado principalmente en la localización de registros duplicados apoyándose en diferentes criterios de búsqueda:
Por código de cliente y dirección: cuando un cliente tiene asociadas más de una dirección, se localizan y marcan aquellas direcciones que están duplicadas para ese cliente.
Por nombre y documento de identidad: localización de duplicados por parecido de nombre e igualdad de documento.
Por nombre y dirección: localización de duplicados por parecido de nombre y dirección.
Esta tarea se ha convertido en cíclica ya que al tratarse de una base de datos “viva”, se hace imprescindible repetir estas fases de forma periódica para tratar las altas y modificaciones reflejadas en los datos.
La duración de esta fase, que ha tratado 14 millones de registros, ha sido de un año. Sin embargo se estima que cada ciclo completo anual de esta fase tendrá una duración aproximada de tres meses.