Logo Estudio General Internet

Análisis de grupos por técnicas de minería de datos

Descripción del estudio:

Se aplican técnicas de aprendizaje supervisado para obtener grupos a partir de los que caracterizar la población de internautas en función de las variables más representativas.

El objetivo de este estudio es obtener el prototipo del usuario que es proclive a realizar compras por Internet.

Notas explicativas y metodológicas

El aprendizaje supervisado se ha realizado a partir de árboles de regresión, debido a la capacidad de este tipo de algoritmos de explicar los resultados obtenidos. La relación entre conjuntos de entrenamiento y de test ha sido de 60% – 40%.

El resultado de la aplicación de dicha técnica es la división de la población inicial en diversos conjuntos ó “bolsas”, cada una de ellas con un patrón de definición diferente.

Estas bolsas pueden ser complementarias, es decir, existen puntos comunes entre ellas, y cubren la totalidad de la población inicial. No obstante, y por razones de claridad, se ha optado por mostrar únicamente las bolsas más representativas, de forma que se cubra la mayor parte de la población, si bien queda una población residual no cubierta por ninguna de las bolsas.

Los métodos utilizados escogen grupos que maximizan la diferencia estadística entre ellos. Además, describen los grupos mediante reglas sencillas, lo cual permite analizar y entender mejor el conjunto original de datos.

Resultados

De los diferentes conjuntos obtenidos, se han seleccionado los más representativos.

  • Grupo 1: caracterizado por los internautas que utilizan banca electrónica, tienen intención de seguir comprando, tienen web propia y un nivel avanzado de inglés. Representan el 4% del total.

  • Grupo 2: internautas usuarios de banca electrónica, tienen intención de seguir comprando y con menos de 3 cuentas de email. Representan el 21% del total.

  • Grupo 3: internautas usuarios de banca electrónica, tienen intención de seguir comprando y con menos de 5 miembros en la familia menores de 30 años. Representan el 42% del total.

  • Grupo 4: internautas con ingresos mayores de 932 euros y con 3 ó 4 cuentas de email. Representan el 21% del total.

  • Grupo 5: internautas usuarios de banca electrónica, tienen intención de seguir comprando y sin web propia. Representan el 15% del total.

Estudio General Internet - Análisis de grupos por técnicas de minería de datos