Capitulo 18
- jimena padilla
- 16 feb 2021
- 4 Min. de lectura
Actualizado: 9 abr 2021
Análisis de datos multivariados.

En este capitulo hablaremos acerca del análisis de datos multivariados y podrás conocer como algunas de las empresas mas reconocidas hacen uso de este análisis
El análisis multivariante siempre se utiliza cuando hay más de tres variables involucradas y el contexto de su contenido no está claro. El objetivo es detectar una estructura por un lado, y verificar los datos de las estructuras por otro.
Procedimientos de análisis multivariado
Los avances en el hardware y software de computación han servido de base para notables adelantos en el uso de eficaces procedimientos estadísticos para el análisis de datos de investigación de mercados. Estos adelantos han hecho posible analizar grandes cantidades de datos complejos con relativa facilidad.
Análisis multivariado
Se refiere al análisis simultáneo de múltiples mediciones de cada individuo u objeto estudiado.
Ejemplo del uso de la estadística y análisis de datos en empresas:
Compañías como Yahoo, Google, Facebook y eBay han tenido que inventar nuevas maneras de capturar y procesar el enorme monto de información que reciben todos los días. Gran parte de esa información carece de la forma y estructura de las bases de datos tradicionales, requiriendo nuevos tipos de analistas y nuevos métodos de análisis.Los científicos de datos deben usar herramientas de vanguardia, programas de fuente abierta y pro gramación personalizada para manipular la información disponible.
LinkedIn estudia relaciones y conexiones existentes para recomendar los mejores grupos a sus miembros e identificar individuos que deberían añadir a sus redes. Amazon revisa constantemente sus algoritmos de recomendaciones de pro ductos, colocación de anuncios y ofertas especiales para brindar máximo valor a sus clientes.
Software multivariado.
Las computadoras personales tienen ahora la potencia necesaria para manejar prácticamente cualquier problema que un investigador de mercados pueda encon trar. La mayoría de esos problemas pueden resolverse en cuestión de segundos, y una extensa gama de programas notables está disponible para el análisis multivariado.
Once técnicas para analizar datos
Análisis de regresión múltiple: Analiza una variable dependiente métrica en relación con múltiples variables independientes métricas
Análisis de regresión logística: Consta de una varia ción de regresión múltiple diseñada para crear una evaluación probabilística de una decisión binaria
Análisis discriminante: Organiza personas y observa ciones en grupos homogéneos. Requiere variables inde pendientes métricas con alta normalidad.
Análisis Multivariado de varianza (MANOVA): Com para variables categóricas independientes con múltiples variables dependientes métricas, determinando rela ciones de dependencia entre varios grupos.
Análisis factorial: Reduce una amplia variedad de variables afines en un conjunto menor de factores no correlacionados.
Análisis de clusters: Crea subgrupos a partir de indivi duos u objetos similares en un gran conjunto de datos.
Escalamiento multidimensional (EM): Usa la repre sentación gráfica perceptual para convertir juicios del consumidor en distancias multidimensionales.
Análisis de correspondencias: Crea un mapa percep tual de calificaciones de atributos de objetos a través de la reducción dimensional.
Análisis conjunto: También conocido como análisis de disyuntivas, mide el valor relativo de los rasgos que comprenden un producto o servicio.
Correlación canónica: Correlaciona variables indepen dientes y dependientes simultáneamente, usando varia bles independientes métricas o variables categóricas no métricas.
Modelación de ecuaciones estructurales (MEE): Emplea varias técnicas para examinar simultáneamente numerosas relaciones entre conjuntos de variables.
Dominio de la gestión de datos
Ciertos bancos han avanzado más que otros en la capacidad de impulsar la adquisición de clientes por medio de datos y análisis, y esas instituciones han comenzado a dominar su propia gestión de datos.
Estas instituciones han llevado la gestión de datos a un alto nivel, también reconocen la importancia de crear estas funciones alre dedor de la gestión de datos en el lugar indicado dentro de la organización.
Big Data y Hadoop.
Big Data
Es el término usado para describir grandes y complejos conjuntos de datos. El Big Data describe los nuevos métodos de captura y gestión de datos diseñados para manejar el mayor volumen, más rápidas tasas de adquisición y amplia variedad de tipos de datos. La mayoría de las herramientas para el Big Data aún están en evolución, e individuos con habilidades para capitalizarlas son escasos.
Hadoop
Es una plataforma de fuente abierta distribuida por Apache para gestionar grandes cantidades de información entre cientos o miles de computadoras enlazadas en red.
Uso del análisis predictivo.
Adquisición de un conjunto de datos
Antes de aplicar el análisis predictivo, una organización debe reunir un conjunto de datos objetivo relevante para el problema de interés. El análisis predictivo solo puede descubrir patrones y relaciones que ya existen en los datos disponibles.
Preprocesamiento
Una vez reunido, el conjunto de datos debe depurarse en un proceso en el que observaciones que contienen excesivo ruido, errores y datos faltantes son corregidas o
excluidas.
Modelación.
Clustering.
Esta es una tarea de descubrimiento de grupos y estructuras en los datos similares en ciertas series selectas de variables.
Clasificación.
Información fácilmente disponible como demografía y geografía puede usarse para clasificar a individuos con base en conductas clave como frecuencia de compra o prefe rencia de productos.
Estimación.
Cálculos como puntajes de riesgo, detección de fraudes, tasas de retención, valor de periodo de vida y probabilidad de tasas de compra pueden hacerse para individuos o grupos.
Validación de resultados
Un último paso de descubrimiento de conocimientos a partir de los datos y la modelación objetivo es tratar de verificar los patrones producidos por los algo ritmos de modelación predictiva en un conjunto de datos más amplio.
Aplicación de los resultados
Una vez instituidos y validados los modelos y cálculos, se les aplica a registros existentes y futuros de clientes para mejorar la eficiencia y efectividad de esfuerzos de marketing.
Comentarios