lunes, 12 de noviembre de 2012

Preparación y Análisis de Datos - CAP 3 (Investigación Situacional del Mercado)



Preparación y Análisis de Datos

La calidad de los resultados estadísticos depende del cuidado que se pone en la etapa de la preparación de los datos con lo cual nos pueden dar conclusiones desviadas e interpretaciones incorrectas.

En esta etapa se incluye la verificación de que los cuestionarios estén completos, analiza la edición de los datos ofreciendo lineamientos en el manejo de respuestas ilegibles incompletas, inconsistentes y ambiguas, descripción de la codificación, transcripción y depuración de datos, poniendo énfasis en el manejo de las respuestas no obtenidas y en el ajuste estadístico de los datos.

Luego el investigador debe seleccionar una estrategia de análisis de datos apropiada, a veces ocurre que la estrategia de análisis de datos final difiere del plan preliminar, la preparación de los datos debe empezar tan pronto como se recibe el primer grupo de cuestionarios, mientras el trabajo de campo se encuentra todavía en proceso.





Verificar Cuestionario
Un cuestionario no puede ser considerado aceptable por las siguientes razones:

  Partes del cuestionario está incompleto.
·         El patrón de respuesta puede indicar que el entrevistado no comprendió o no siguió instrucciones.
·         Las respuestas presentan poca variación.
·         El cuestionario está incompleto físicamente (faltan preguntas).
·         El cuestionario se recibe después de la fecha de corte establecida.
·         Una persona no calificada respondió al cuestionario.

Edición
Consiste en la supervisión de los cuestionarios para identificar respuestas ilegibles, incompletas, inconsistentes.

Ejemplo

·         Un encuestado gana poco, pero hace compras en lugares caros.
·         Respuestas abreviadas
·         Responder con 2 opciones cuando existe una sola posibilidad.

Las respuestas no satisfactorias se manejan nuevamente en el campo al buscar mejores datos, asignar los valores faltantes o descartar a los entrevistados no satisfactorios.  El regresar al campo para buscar los faltantes, es una buena estrategia en mercados industriales y de negocios donde el tamaño de muestra es reducido y los entrevistados son de fácil localización.

Codificación

Asignar un código, por lo regular puede ser un número a cada respuesta posible por cada pregunta, si el cuestionario tiene preguntas estructuradas se precodifica, antes de salir al campo, si no lo son se codifica luego del trabajo en el campo, es conveniente utilizar un código de campo fijo, que significa que el número de registro para cada entrevistado es el mismo y los mismos datos aparecen en las mismas columnas para todos los entrevistados.

Ejemplo:

Sexo

1.       Mujeres
2.       Hombres

Un registro consiste en campos relacionados, sexo, estado civil, edad, características sociodemográficas….

Directores de Código: contiene las instrucciones para la codificación y la información necesaria acerca de las variables en el conjunto de datos, por lo general posee un número de columna, número de registro, número de variable, número de pregunta e instrucciones  de codificación.

Transcripción:
Comprende la transferencia de los datos codificados del cuestionario u hojas de codificación a medis informáticos, se puede utilizar el rastreo óptico en la transcripción de los datos del código universal del producto como en los supermercados.
Depuración de datos:

·         Manejo de preguntas no respondidas:
o   Sustitución  de un valor neutral:  por lo general un valor medio o neutral que no afecta a las otras estadísticas.
o   Sustitución de una respuesta imputada: mediante la utilización de un patrón de respuesta de los entrevistados a otras preguntas se puede imputar, por ejemplo, el relacionar la frecuencia o uso de un producto con el tamaño de la familia.
o   Eliminación del caso según criterio del investigador: aquí se descarta totalmente la encuesta del análisis por cualquier pregunta no respondida.
o   Eliminación apareada según criterio del investigador: aquí se descarta solo los casos con valores faltantes y utiliza las respuestas completas para su análisis.

 Ajuste estadísticos de los datos:
Consiste en la ponderación, redefinición de variables y transformación de escalas.

·         Ponderación: se asigna un valor  relative a cada caso o entrevistado en base de los datos, a fin de reflejar su importancia relativa para otros casos o entrevistados.
·         
      Redefinición de variables: Implica la transformación de los datos para crear nuevas variables existentes. El propósito de la redefinición es crear variables que sean consistentes con objetivos del estudio. Un procedimiento de redefinición comprende el uso de variable modelo.

·         Variable modelo:  se conoce también como variable binaria, dicotómica, que toman solo 2 valores (0 y 1).

Transformación de escala: comprende la manipulación de los valores de la escala para asegurar la compatibilidad con otras escalas, por ejemplo, la variable imagen  puede medirse con una escala diferencial semántico, la variable actitud con una escala de calificación continua, la variable estilo de vida con una escala de Likert de 5 puntos. Cuando se realiza un cruce de variables es necesario tenerlas todas en una misma escala para que tenga sentido su realización.

Selección de una estrategia para el análisis de datos

La selección de esta estrategia debe basarse en los primeros pasos del proceso de investigación de mercados, las características conocidas de los datos,  las propiedades de las técnicas estadísticas y los antecedentes, el plan preliminar de análisis de datos que se preparó como parte del diseño de la investigación debe utilizarse como base,  quizás sean necesarios algunos cambios, en vista de la transformación adicional que se genere  en las etapas subsecuentes del proceso de  investigación.

Para el procesamiento de los datos y para los cruces variables y obtener datos valiosos es mas fácil utilizar programas estadísticos como el SPSS o el Minitab, ayudado con herramientas en excell (macros).



Ejemplo de Investigación de Mercado





                        







  
    


¿De las siguientes características asociadas a este dispositivo, qué importancia le otorgaría usted a cada una de ellas?




       




Conclusiones:

       Más de la mitad de los encuestados afirman haber comprado un dispositivo para la realización de un examen parasitológico.

       El 38% de las personas encuestadas  le gusta que el producto preserve la muestra.  El 27% que quita el mal olor.

       El 63% de las personas encuestadas están dispuestas a pagar $2.01.

Este es solo un ejemplo de la información con lo que una investigación de mercados  puede ayudar en la toma de decisión para las estrategias de comercialización de un producto, pueden realizarse investigaciones de aceptación de un producto incluso de actores políticos y deportivos.

Espero que les ayude en algo toda la información de este capítulo para la toma de decisiones en los temas de comercialización de cualquier organización.


lunes, 29 de octubre de 2012

Elaboración de cuestionarios - CAP 2 (Investigación Situacional del Mercado)


Elaboración de Cuestionarios
Para realizar cuestionarios es indispensable saber el número que se deben hacer, obteniendo una muestra adecuada con un rango poblacional de esta  manera se obtendra un  nivel de confianza estadístico para su interpretación y posible ejecución, hay varias formas de saberlo, por ejemplo:

Cálculo del Tamaño de la Muestra desconociendo el Tamaño de la Población.  *

La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la población es la siguiente:  


en donde,  
Z = nivel de confianza,  
P = probabilidad de éxito, o proporción esperada 
Q = probabilidad de fracaso  
D = precisión (error máximo admisible en términos de proporción)   

Por ejemplo:

¿A cuántas familias tendríamos que estudiar para conocer la preferencia del mercado en cuanto a las marcas de shampoo para bebé, si se desconoce la población total?  

Seguridad = 95%;  
Precisión = 3%; 
Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.
  
Entonces: 

• Z 2α  = 1.962 (ya que la seguridad es del 95%) 
• p = proporción esperada (en este caso 5% = 0.05) 
• q = 1 – p (en este caso 1 – 0.05 = 0.95) 
• d = precisión (en este caso deseamos un 3%) 


 Se requeriría encuestar a no menos de 203 familias para poder tener una seguridad del 95%.

¿Cómo hubiera cambiando el ejemplo anterior, si se desconoce la proporción esperada?  
Cuando se desconoce la proporción esperada, se tiene que utilizar el criterio conservador (p = q = 0.5), lo cual maximiza el tamaño de muestra de la siguiente manera: 

• Z 2α   = 1.962  (ya que la seguridad es del 95%) 
• p = proporción esperada (en este caso 50% = 0.5) 
• q = 1 – p (en este caso 1 – 0.5 = 0. 5) 
• d = precisión (en este caso deseamos un 3%)  quedando como resultado:    




Se requeriría encuestar a no menos de 1068 familias para poder tener una seguridad del 95%.

Cálculo del Tamaño de la Muestra conociendo el Tamaño de la Población:
 
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la población es la siguiente:


en donde,  

N = tamaño de la población 
Z = nivel de confianza,  
P = probabilidad de éxito, o proporción esperada 
Q = probabilidad de fracaso  
D = precisión (Error máximo admisible en términos de proporción)

¿A cuántas familias tendríamos que estudiar para conocer la preferencia del mercado en cuanto a las marcas de shampoo para bebé, si se conoce que el número de familias con bebés en el sector de interés es de 15,000? 

Seguridad = 95%;  
Precisión = 3%;  
Proporción esperada = asumamos que puede ser próxima al 5%; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.




Se requeriría encuestar a no menos de 200 familias para poder tener una seguridad del 95%.

¿Cómo hubiera cambiando el ejemplo anterior, si se desconoce la proporción esperada?  Si se desconoce la proporción esperada, se tendría que utilizar el criterio conservador (p = q = 0.5), lo cual maximiza el tamaño de muestra de la siguiente manera: 

Z 2α   = 1.962 (ya que la seguridad es del 95%) 
• p = proporción esperada (en este caso 50% = 0.5) 
• q = 1 – p (en este caso 1 – 0.5 = 0. 5) 
• d = precisión (en este caso deseamos un 3%)  quedando como resultado: 





Se requeriría encuestar a no menos de 997 familias para poder tener una seguridad del 95%

*El tema de diseño de la muestra fue tomado del Boletín Electrónico No. 02 , Facultad de Ingeniería - Universidad Rafael Landívar , realizado por Inga. Mariela Torres, Inga. Karim Paz, e Ing. Federico G. Salazar.

El cuestionario

Un cuestionario ya sea que se trate de un programa. Una forma de entrevista o un instrumento de medición, es un conjunto formal de preguntas para obtener información por parte de los entrevistados por lo regular, el cuestionario es solo un elemento de un paquete de recopilación de datos que también puede incluir:

  •     Los procedimientos del trabajo de campo, como las instrucciones para seleccionar acercarse e                                                                         interrogar a los entrevistados.
  •       Alguna recompensa, regalo o pago que se ofrece a los entrevistados.
  •        Apoyos para la comunicación, como mapas, fotografías, anuncios y productos.


La gran debilidad del diseño del cuestionario es la falta de teoría, puesto que no existe ningún principio científico que garantice un cuestionario óptimo o ideal, el diseño de cuestionarios es una habilidad que se adquiere con la experiencia, se trata de un arte más que de una ciencia.

El diseño del cuestionario se presentara como una serie de pasos y daremos lineamientos para cada paso. En la práctica, los pasos están interrelacionados y el desarrollo de un cuestionario comprenderá cierta interacción y conexión, por ejemplo, es probable que el investigador descubra que los entrevistados interpreten mal cierto estilo de redacción de una pregunta específica. Quizá sea necesario regresar al primer paso para decidir la estructura de la pregunta.






Objetivos
·         Debe traducir la información necesaria a un conjunto de preguntas específicas que los entrevistados pueden contestar, es difícil desarrollar preguntas que los participantes pueden responder y que produzcan la información deseada. Dos maneras al parecer iguales, de formular preguntas puede producir distinta información por consiguiente este objetivo constituye un reto.
·     Un cuestionario debe levantar la moral, motivar y alentar, al diseñar un cuestionario el investigador debe buscar minimizar la fatiga, el aburrimiento y el esfuerzo del entrevistado a fin de evitar las respuestas incompletas y falta de respuestas.
·     El cuestionario también  debe minimizar el error de la respuesta. Las fuentes potenciales de error en los diseños de investigación surgen cuando los entrevistados dan respuestas inexactas o cuando sus respuestas se registran o analizan de manera incorrecta.

Condición de la estructura de las preguntas:
·         
      Preguntas no estructuradas, estas son preguntas abiertas que los entrevistados contestan con sus propias palabras, por ejemplo,  Cuál es su ocupación?, Quién es su político favorito? Etc…

·         Preguntas estructuradas, este tipo de preguntas especifican el grupo de alternativas de respuesta y el formato de respuesta por ejemplo: ¿qué encuentra diferente en esta empresa a otras? ¿hable de sus trabajos anteriores?

·         Preguntas de opción múltiple:  el investigador pide una serie de respuestas y se pide a los entrevistados que seleccionen uno o más de las alternativas ofrecidas.

·         Preguntas dicotómicas: solo tiene dos alternativas de respuesta si o no, o deacuerdo o desacuerdo. Con frecuencia los dos alternativas de interés se complementan con una alternativa neutral, como: no opino, no se, ambos o ninguno.

Uso de palabras no ambiguas
Las palabras que se utilizan en un cuestionario deben tener un solo significado que conozcan los entrevistados. Muchas palabras que aparecen son ambiguas tiene diversos significados para distintas personas estas incluyen “por lo general”, “por lo regular” , “con frecuencia”, “muy seguido”, “algunas veces”.

Evite las alternativas implícitas:
Hacer una alternativa implícita puede incrementar el porcentaje de personas que la seleccionan y no obtendremos los resultados deseados, un ejemplo estas dos preguntas
·         Les gusta viajar en avión cuando recorre distancias cortas?
·         Les gusta viajar en avión cuando recorre distancias cortas o prefiere hacerlo en automóvil?

Estrategia de embudo:
Es la estrategia para ordenar las preguntas de un cuestionario en la que la secuencia empieza con las preguntas generales, seguidas por preguntas cada vez más específicas, a fin de evitar que las preguntas especifican desvíen las generales.

Pregunta ramificación:
Se utiliza para guiar a un entrevistador durante una encuesta, llevándolo hacia distintos puntos del cuestionario dependiendo de las respuestas obtenidas.

Precodicación:
En el diseño de cuestionarios, asignar un código a rodas la respuesta posibles, antes de la recopilación de los datos.

Medición y Escalas:

Medición:  Asignación de números u otros signos de las características de los objetos, de acuerdo con ciertas reglas especificadas.

Escala:  Generación de un continuo en el que se colocan los objetos medidos.

Escalas de Medición Primaria:

·         Escala Nominal:  Escala cuyos números sirven solo como etiquetas o señales para identificar los objetos, con una correspondencia estricta de uno a uno entre los números y los objetos , permite cálculos estadísticos limitados como porcentajes, moda, chi cuadrada.

·         Escala Ordinal: Escala de clasificación que nos permite determinar si un objeto tiene más o menos cantidad de cierta característica que algún otro, pero no cuánto más o menos, los posibles cálculos estadísticos que se obtienen con esta escala es la mediana y la correlación, por ejemplo clasificar a tiendas departamentales en orden de preferencia.

·         Escala de intervalos:  Poseen distancias numéricas iguales, en la escala representan valores iguales en las característica que se mida, los cálculos estadísticos que se pueden realizar cuando se realiza esta escala son la media aritmética, desviación estándar y correlaciones, esta escala se caracteriza en que el punto cero no es fija como en la escala de temperatura o tiempo.

·         Escala de relación: Escala más alta, permite que el investigador identifique o clasifique los objetos, los coloque en orden de clasificación y compare los intervalos o diferencias, permite calcular las relaciones de valores de escala y a todos los cálculos de todas las aplicaciones estadísticas, por ejemplo, estatura, edad, peso….


   

     Comparación de las Técnicas de Escalas





      Escalas Comparativas:

     Comprenden la comparación directa de los objetos de estímulo entre sí, por ejemplo, puede preguntarse a los entrevistados si prefieren Coca Cola o Pepsi, los datos de esta escala deben interpretarse en términos relativos y tienen sólo propiedades ordinales o de orden de clasificación, por esta razón, las escalas, comparativas se conocen también como escalas no métricas.

     El beneficio principal es que pueden detectarse las pequeñas diferencias entre los objetivos del estímulo, al comparar los objetos de estímulo, los entrevistados se ven obligados a elegir entre éstos además los participantes consideran la tarea de calificación desde los mismos puntos de referencia conocidos.

    Escalas No Comparativas

     Conocidas también como escalas métricas o monádicas, cada objeto se evalúa en forma independiente de los otros objetos del conjunto de estímulos, por lo general, se supone que los datos que se resultan se encuentran en una escala de intervalos o relación, un ejemplo

·     Puede pedirse a los entrevistados que evalúen Pepsi en una escala de preferencia de 1 a 6 ( 1 = no se prefiere, 6= se prefiere en gran medida).

    Técnicas de escalas comparativas

    Escala de Comparación Apareada
     Se presenta al entrevistado 2 objetos y se les pide que seleccione uno, los datos obtenidos son de naturaleza ordinal.   Ejemplos, una entrevista puede afirmar que hacer sus compras en Supermaxi con mayor frecuencia que en Mi Comisariato y prefiere Parmalat a Vitaleche.
      
      Esta escala se utiliza frecuentemente cuando los objetos de estímulo son productos físicos, a  continuación, la tabla de resultados muestra los datos de una comparación apareada para evaluar las preferencias en champú:

    Instrucciones:
o   Vamos a presentar 10 pares de marcas de champú. En cada par, indique por favor, cuál de las 2 marcas de champú que forman el par prefería para el uso personal.
o   Forma de registro



      El 1 en un cuadro en particular significa que la marca en esa columna se prefirió a la marca en el renglón correspondiente, 0 significa que la marca del renglón se prefirió a la marca de la columna.

      En general, con n marcas, (n (n-1)/2) comparaciones apareadas incluyen todos los pares de objetos posibles, los datos de comparaciones apareadas pueden analizarse de varias formas, también es posible la evaluación simultánea de todos los objetos de estímulo, para poder llegar a un orden de clasificación el investigador determina el número de veces que se prefiere cada marca, al sumar las entradas de las columnas de la tabla, por tanto, el orden de preferencia de este entrevistado, de la menos a la más preferida es D,A,B,E y C, esta escala es útil cuando el número de marcas es limitado, ya que se requiere de la comparación directa y elección abierta, otras desventajas son que pueden ocurrir violaciones a la suposición de la transición y que el orden en el que presentan los objetos pueden influir en los resultados.

Escala por Orden de Clasificación
      Se presentan a los entrevistados varios objetos en forma simultánea y se les pide los ordenen o clasifiquen de acuerdo con cierto criterio.Por ejemplo, puede pedirse a los participantes que clasifiquen las marcas de pasta dentales de acuerdo con sus preferencias generales, como se muestran en la siguiente tabla:

Instrucciones:
§  Clasifique las distintas marcas de pastas dentales en orden de preferencia.
§  Comience por elegir aquella marca que más le agrade y asígnele el número 1.
§  Después, busque la segunda marca que prefiere y asígnele el número 2.
§  Continúe con este procedimiento hasta que haya clasificado todas las marcas de pasta dentales en orden de preferencia.
§  A la marca que menos prefiere debe asignarle el número 10.
§  No debe asignar a dos marcas el mismo número  de clasificación.
§  El criterio de preferencia depende por completo de la persona consultada, no hay respuestas correctas ni incorrectas, se espera que las respuestas tengan una constancia elevada.



   Al igual que las comparaciones apareadas, esta estrategia tiene también una naturaleza comparativa y es probable que al entrevistado le disguste en un sentidoabsoluto la marca que clasificó como 1, además las escalas de orden de clasificación también dan como resultado datos ordinales.
     Los datos de orden de clasificación se obtienen, con frecuencia  de los entrevistados en el análisis asociado, puesto que obligan al participante a discriminar entre los objetos de estímulo, lleva menos tiempo y elimina l, si hay n objetos de estímulo, solo hay que tomar   (n-1) decisiones.

Escala de Suma de Constantes

   Los entrevistados distribuyen una cantidad constante de unidades, como puntos, dólares o fichas, entre un conjunto de objetos de estímulo con respecto a cierto criterio, como se muestra en la tabla siguiente, puede pedirse a los entrevistados que distribuyan 100 puntos entre los atributos de un jabón de tocador de  manera que reflejen la importancia que den a cada atributo.

Instrucciones:

§  A continuación se presentan 8 atributos de los jabones de tocador.
§  Favor distribuir 100 puntos entre los atributos, de modo que su distribución refleje la importancia relativa que da a cada atributo.
§  Cuando más puntos recibe un atributo, es más importante.
§  Si un atributo es 2 veces más importante que algún otro, debe recibir el doble de puntos.







    Los atributos se colocan en la escala al contar los puntos que todos los entrevistados asignaron a cada uno y dividiendo esta cantidad entre el número de participantes. En la tabla, estos resultados se presentan para 3 grupos o segmentos de entrevistados, el segmento 1 da importancia al precio, el segmento 2 considera que el poder limpiador tiene importancia primordial para el segmento 3 valora la espuma, la fragancia, el ingrediente, humectante y el poder limpiador. La ventaja principal es que permite la discriminación apropiada entre los objetos de estímulo sin requerir de mucho tiempo.
                  
                  Las desventajas son:

   o   Es probable que los entrevistados distribuyan más o menos unidades que las que se    especifican. Por ejemplo, un entrevistado puede distribuir 108 o 94 puntos. El investigador debe modificar de alguna manera los datos o eliminar el análisis al entrevistado.
    o   Es un error al redondear si se utilizan muy pocas unidades.
   o   El uso de un número alto de unidades puede ser muy difícil para el entrevistado y provocar confusión o fatiga.

  Técnicas de Escalas no Comparativas

Escala de clasificación continúa
     También conocida como escala de calificación gráfica, los entrevistados califican a los objetos
    escribiendo una marca en la posición apropiada sobre una línea que va de un extremo de la variable  de    criterio al otro. Los participantes no están limitados a seleccionar marcas que el investigador establece con anterioridad, la forma de una escala continua puede variar de modo considerable, de la siguiente manera:

§  La línea puede ser vertical u horizontal.
§  Los puntos de la escala pueden proporcionar en forma de números o descripciones breves.
§  Si se proporciona, los puntos de la escala pueden ser pocos o muchos.
                            
                 A continuación se ilustran 3 versiones de una escala de clasificación continua.     
       
                 Qué clasificación darían al Quicentro como tienda departamentales?  





    Una vez que el participante proporciona las calificaciones, el investigador divide la línea en tantas categorías como desee y asigna las calificaciones con base en las categorías a las que pertenecen, por lo general estas escalas se manejan como datos de intervalo, tiene varias ventajas, pues son más fáciles de elaborar, aunque la respuesta es confusa poco confiable y no aporta mucha información nueva.

Escala de clasificación de partidas:

   Se proporciona a los entrevistados una escala que tiene una descripción breve o un número relacionado con cada categoría, estás categorías se ordenan  en términos de posición en la escala, y se pide a los participantes seleccionen la categoría específica que describe mejor el objeto a calificar, esta escala es la de mayor utilización en la investigación de mercados.





             Escala de Likert

          Pide a los entrevistados que indiquen un grado de acuerdo o desacuerdo con cada una de la serie de                   afirmaciones respecto a los objetos de estímulo, tiene 5 alternativas de respuesta, lo interesante de esta escala es que es de fácil aplicación por su facilidad de uso es adecuada para entrevistas en centros comerciales, telefónicas o a nivel personal, complica su ejecución el tiempo que toma en hacerlo pues los entrevistados  deben leer cada afirmación.



Escala de diferencial semántico

Es una escala de calificación con 7 puntos, cuyos puntos finales se relacionan con niveles bipolares que tienen un significado semántico, en una aplicación típica, los entrevistados califican los objetos con base en varias escalas de clasificación de partidas con 7 puntos, limitadas en cada extremo con uno de 2 adjetivos bipolares, como “frío” y “caliente”.







Escala de Stapel
     
      Es una escala de calificación unipolar con 10 categorías numeradas de  -5  a +5, sin un punto neutral (cero), casi siempre se presenta en sentido vertical, cuanto más altos sean los números, el término describe el objeto con mayor exactitud.