top of page
Buscar

Capitulo 18

  • Foto del escritor: jimena padilla
    jimena padilla
  • 16 feb 2021
  • 4 Min. de lectura

Actualizado: 9 abr 2021

Análisis de datos multivariados.




En este capitulo hablaremos acerca del análisis de datos multivariados y podrás conocer como algunas de las empresas mas reconocidas hacen uso de este análisis

El análisis multivariante siempre se utiliza cuando hay más de tres variables involucradas y el contexto de su contenido no está claro. El objetivo es detectar una estructura por un lado, y verificar los datos de las estructuras por otro.


Procedimientos de análisis multivariado


Los avances en el hardware y software de computación han servido de base para notables adelantos en el uso de eficaces procedimientos estadísticos para el análisis de datos de investigación de mer­cados. Estos adelantos han hecho posible analizar grandes cantidades de datos complejos con relativa facilidad.


Análisis multivariado


Se refiere al análisis simultáneo de múltiples mediciones de cada individuo u objeto estudiado.


Ejemplo del uso de la estadística y análisis de datos en empresas:


Compañías como Yahoo, Google, Facebook y eBay han tenido que inventar nuevas maneras de capturar y procesar el enorme monto de información que reciben todos los días. Gran parte de esa información carece de la forma y estruc­tura de las bases de datos tradicionales, requiriendo nuevos tipos de analistas y nuevos métodos de análisis.Los científicos de datos deben usar herramien­tas de vanguardia, programas de fuente abierta y pro­ gramación personalizada para manipular la información disponible.

LinkedIn estudia relaciones y conexiones existentes para recomendar los mejores grupos a sus miembros e identificar individuos que deberían añadir a sus redes. Amazon revisa constantemente sus algoritmos de recomendaciones de pro­ ductos, colocación de anuncios y ofertas especiales para brindar máximo valor a sus clientes.


Software multivariado.


Las computadoras personales tienen ahora la potencia necesaria para manejar prácticamente cualquier problema que un investigador de mercados pueda encon­ trar. La mayoría de esos problemas pueden resolverse en cuestión de segundos, y una extensa gama de programas notables está disponible para el análisis multivariado.


Once técnicas para analizar datos


  1. Análisis de regresión múltiple: Analiza una variable dependiente métrica en relación con múltiples variables independientes métricas

  2. Análisis de regresión logística: Consta de una varia­ ción de regresión múltiple diseñada para crear una evaluación probabilística de una decisión binaria

  3. Análisis discriminante: Organiza personas y observa­ ciones en grupos homogéneos. Requiere variables inde­ pendientes métricas con alta normalidad.

  4. Análisis Multivariado de varianza (MANOVA): Com­ para variables categóricas independientes con múltiples variables dependientes métricas, determinando rela­ ciones de dependencia entre varios grupos.

  5. Análisis factorial: Reduce una amplia variedad de varia­bles afines en un conjunto menor de factores no correla­cionados.

  6. Análisis de clusters: Crea subgrupos a partir de indivi­ duos u objetos similares en un gran conjunto de datos.

  7. Escalamiento multidimensional (EM): Usa la repre­ sentación gráfica perceptual para convertir juicios del consumidor en distancias multidimensionales.

  8. Análisis de correspondencias: Crea un mapa percep­ tual de calificaciones de atributos de objetos a través de la reducción dimensional.

  9. Análisis conjunto: También conocido como análisis de disyuntivas, mide el valor relativo de los rasgos que comprenden un producto o servicio.

  10. Correlación canónica: Correlaciona variables indepen­ dientes y dependientes simultáneamente, usando varia­ bles independientes métricas o variables categóricas no métricas.

  11. Modelación de ecuaciones estructurales (MEE): Emplea varias técnicas para examinar simultáneamente numerosas relaciones entre conjuntos de variables.

Dominio de la gestión de datos


Ciertos bancos han avanzado más que otros en la capacidad de impulsar la adquisición de clientes por medio de datos y análisis, y esas instituciones han comenzado a dominar su propia gestión de datos.

Estas instituciones han llevado la gestión de datos a un alto nivel, tam­bién reconocen la importancia de crear estas funciones alre­ dedor de la gestión de datos en el lugar indicado dentro de la organización.


Big Data y Hadoop.


Big Data


Es el término usado para describir grandes y complejos conjuntos de datos. El Big Data describe los nuevos métodos de captura y gestión de datos diseñados para manejar el mayor volumen, más rápidas tasas de adquisición y amplia va­riedad de tipos de datos. La mayoría de las herramientas para el Big Data aún están en evolución, e individuos con habilidades para capitalizarlas son escasos.


Hadoop

Es una plataforma de fuente abierta distribuida por Apache para gestionar grandes cantidades de información entre cientos o miles de computadoras enlazadas en red.


Uso del análisis predictivo.


Adquisición de un conjunto de datos


Antes de aplicar el análisis predictivo, una orga­nización debe reunir un conjunto de datos objetivo relevante para el problema de interés. El análisis predictivo solo puede descubrir patrones y relaciones que ya existen en los datos dis­ponibles.


Preprocesamiento


Una vez reunido, el conjunto de datos debe depurarse en un proceso en el que observaciones que contienen excesivo ruido, errores y datos faltantes son corregidas o

excluidas.


Modelación.


Clustering.


Esta es una tarea de descubrimiento de grupos y estructuras en los datos similares en ciertas series selectas de variables.


Clasificación.


Información fácilmente disponible como demografía y geografía puede usarse para clasificar a individuos con base en conductas clave como frecuencia de compra o prefe­ rencia de productos.


Estimación.


Cálculos como puntajes de riesgo, detección de fraudes, tasas de retención, valor de periodo de vida y probabilidad de tasas de compra pueden hacerse para individuos o grupos.


Validación de resultados


Un último paso de descubrimiento de conocimientos a partir de los datos y la modelación objetivo es tratar de verificar los patrones producidos por los algo­ ritmos de modelación predictiva en un conjunto de datos más amplio.


Aplicación de los resultados


Una vez instituidos y validados los modelos y cálculos, se les aplica a registros existentes y futuros de clientes para mejorar la eficiencia y efectividad de esfuerzos de marketing.


 
 
 

Comentarios


Suscríbete aquí para recibir las últimas publicaciones

¡Gracias por formar parte de nuestro blog!

©2021 by The Book Lover. Proudly created with Wix.com

  • Facebook
  • Twitter
bottom of page