GLOSARIO DE CONCEPTOS BÁSICOS DE ESTADÍSTICA

Este Glosario le permite acceder fácilmente a una definición sencilla de
los principales términos utilizados en estadística ordenados alfabéticamente. 

A

AFIJACIÓN DE UNA MUESTRA.- Es un método utilizado para establecer cómo debe distribuirse la muestra. En un muestreo estratificado, se refiere generalmente a la determinación del número de unidades en la muestra de cada estrato. En el muestreo por conglomerados, se refiere a la decisión sobre el número de conglomerados por seleccionar y el tamaño de la muestra en cada conglomerado. 
AFIJACIÓN ÓPTIMA DE UNA MUESTRA. - Es la forma de seleccionar una muestra de manera tal que produzca un error estándar mínimo para un tamaño de muestra constante. Se utiliza en muestreo estratificado y en muestreo por conglomerados. 
AMPLITUD DE UN INTERVALO.- Conocido también como amplitud de clase, es la diferencia entre los dos extremos de un intervalo. 
ANÁLISIS DE CONTINGENCIA.- Es el estudio que se realiza con las tablas de contingencia y consiste en analizar el grado de asociación o dependencia entre dos variables cualitativas; para medir el grado de dependencia se utiliza el coeficiente de contingencia.
ANÁLISIS DE CORRELACIÓN.- Es el estudio que se realiza para medir la intensidad o grado de la asociación que existe entre variables numéricas. 
ANÁLISIS DE REGRESIÓN.- Es el estudio que se realiza con el propósito de hacer predicciones.  El objetivo es el desarrollo de un modelo estadístico que pueda ser utilizado para predecir valores de una variable dependiente, basado en los valores de la variable independiente. 
ANÁLISIS DE VARIANZA.- Es un método para comparar dos o más medias (Ver media) de «n» grupos analizando la varianza de los datos,  tanto entre «n» grupos como dentro de ellos. 
ASIMETRÍA.- Es la falta de simetría entre los datos de una distribución. El concepto de asimetría se refiere a si la curva que forman los valores de la serie presenta la misma forma a la izquierda y derecha de un valor central (media aritmética). 
AUTOCORRELACIÓN.- Se denomina así a la correlación de una variable consigo misma cuando se desfasa uno o más periodos de tiempo. Se determina calculando el coeficiente de autocorrelación.

B

BASE DEL ÍNDICE.- Es la magnitud utilizada como unidad de referencia, contra la cual se hacen todas las comparaciones de la variable en estudio. Esta base puede corresponder a un año, un trimestre, un mes, etc. 
BONDAD DE AJUSTE.- Es un indicador que permite discernir acercan de qué tan buena es la ecuación obtenida. 

C

CARTOGRAMAS.- Es un tipo de gráfico mediante el cual se muestra datos estadísticos sobre una base geográfica como mapas. 
CENSO.- Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que componen la población por investigar. Es necesario que se especifique  el espacio y el tiempo al que se refiere el recuento. 
CLASE MEDIANA.- En una tabla de datos agrupados, es la clase o intervalo al que pertenece el valor de la mediana.
CLASE MODAL.- En una tabla de datos agrupados, es la clase o intervalo que tiene la mayor frecuencia.
CLASE O CATEGORÍA.- Se denomina así a la característica o a los intervalos construidos convenientemente para agrupar la información. Está conformada por el número de particiones que se realiza al conjunto de información. 
CODIFICACIÓN.- Es asignar números o claves a la información para facilitar el procesamiento. Generalmente se realiza sobre las respuestas de un cuestionario, para  poder identificar las con mayor eficacia al momento del procesamiento de datos. 
COEFICIENTE DE ASIMETRÍA DE FISHER.- Es un valor que indica la asimetría.
COEFICIENTE DE ASIMETRÍA DE PEARSON.- Es un valor que  indica la asimetría. 
COEFICIENTE DE CONFIANZA.- Se representa por (1-   ) y es la probabilidad de que la hipótesis nula Ho  no sea rechazada cuando de hecho es verdadera y debería ser aceptada. 
COEFICIENTE DE CONTINGENCIA Chi-Cuadrado (c - ). Es un número que mi de el  grado de asociación o dependencia de las clasificaciones en una tabla de contingencia.
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON.- Es un número que mide la intensidad de la asociación lineal entre dos variables. El coeficiente de correlación se representa simbólicamente por "r". 
COEFICIENTE DE CURTOSIS.- Es una medida de forma.
COEFICIENTE DE DETERMINACIÓN.- Es un valor que se obtiene elevando al  cuadrado el  coeficiente de correlación. Se representa simbólicamente por r 2  y puede tomar valores entre 0 y 1. 
COEFICIENTE DE GINI.- . Es una medida de la desigualdad.  
COEFICIENTE DE VARIACIÓN DE PEARSON.- Es una medida de dispersión relativa y se calcula dividiendo la desviación típica entre la media aritmética.
COMBINACIONES.- Consiste en tomar diferentes agrupaciones de r elementos de un total de n objetos sin importar el orden, y el número de combinaciones. 
CONCENTRACIÓN.- Cuantifica el grado de equidistribución de la distribución de un fenómeno: salarios, rentas etc. 
CONGLOMERADO.- Es una subpoblación que reúne características presentes en la población. Los elementos que la componen poseen cierta característica que les hace ser propios de cierta cualidad o atributo.
CONTRASTE DE HIPÓTESIS.- Conocido también como dócima o prueba de hipótesis, es el proceso estadístico que se sigue para la toma de decisiones a partir de la información de la muestra. 
CORRELOGRAMA. - E s  un  gráfico  que  p e r mi t e  aprecia r  las autocorrelaciones
COVARIANZA.- Es una medida de la asociación lineal  entre dos variables. 
CUARTIL.- Es una medida de posición no central o de localización. Los cuartiles son los tres valores que dividen la distribución en cuatro partes iguales.


DATO.- Conocido también como información, es el valor de la variable asociada a un elemento de una población o una muestra. 
DATO CUALITATIVO.- Es aquel que representa alguna característica de los elementos de una muestra o una población que  presentan, atributos, actitudes o son opiniones. Son datos NO NUMÉRICOS.
DATO CUANTITATIVO.- Es aquel  dato numérico que representa aspectos de una muestra o una población que es medible o que se puede contar.
DATOS DE PANEL.- Son aquellos datos que son una combinación de series de tiempo y datos de sección cruzada o corte transversal  que se obtienen sobre un mismo conjunto de unidades de análisis (individuos, familias o empresas) en distintos periodos de tiempo.
DENSIDAD DE POBLACIÓN.- Es la medida más tradicional y usada con mucha frecuencia para expresar el número de habitantes por kilómetro cuadrado. Se calcula dividiendo el número de habitantes de una zona por la superficie total que tiene esa zona.
DESVIACIÓN ESTÁNDAR.- Conocida también como desviación típica, es una medida de dispersión que se obtiene como la raíz cuadrada de la varianza.
DESVIACIÓN MEDIA.- Es una medida de dispersión.  Es un número que representa la media de los valores absolutos de las desviaciones respecto a su media aritmética.
DESVÍO TIPIFICADO (z).- Conocido también como estandarización de la distribución normal.
DISTRIBUCIÓN BIDIMENSIONAL.- Es la disposición de la frecuencia de dos variables de cada elemento de la población.  Por ejemplo: peso y altura de un grupo de estudiantes.
DISTRIBUCIÓN CONDICIONAL.- De una tabla de frecuencias bidimensionales se puede formar varias distribuciones unidimensionales en las que previamente hace falta definir una condición. 
DISTRIBUCIÓN MARGINAL.- Es la distribución de frecuencias de una variable independientemente de cómo se comporta la otra variable de una distribución bidimensional.
DISTRIBUCIÓN NORMAL O CURVA NORMAL.- Llamada también como distribución de Gauss, es la distribución de probabilidad más utilizada en estadística y teoría de probabilidad.




ENCUESTA.- Es un método de recolección de datos.  Es llevada a cabo generalmente a través de algún cuestionario que puede o no ser diligenciado por el encuestado y/o encuestador.
ENTREVISTA.- Es un método de recolección de datos. Consiste en una serie de preguntas realizadas por el entrevistador,  personalmente, a cada uno de los entrevistados.
ERROR DE MUESTREO.- Conocido también como error muestral, es la diferencia que existe entre el valor real (parámetro) obtenido con los de la población y el valor estimado en base a los valores de una muestra (estimación).
ERROR TIPO I.- En la teoría de decisiones, es el error que se comete al rechazar la hipótesis nula Ho , cuando es verdadera. 
ERROR TIPO II.- En la teoría de decisiones, es el error que se comete al aceptar la hipótesis nula Ho cuando es falsa.
ESPACIO MUESTRAL.- Es el conjunto de todos los resultados posibles de un experimento aleatorio.
ESTADÍSTICA.- Es la ciencia que comprende una serie de métodos y procedimientos destinados a la recopilación, tabulación, procesamiento, análisis e interpretación de  datos cuantitativos y cualitativos.
ESTADÍSTICA DESCRIPTIVA.- Rama de la ciencia estadística que se encarga desde la recopilación, procesamiento y análisis de la información siendo sus conclusiones válidas sólo para el grupo analizado.
ESTADÍSTICA INFERENCIAL.- Rama de la ciencia estadística que proporciona métodos y procedimientos que permiten obtener conclusiones para una población a partir del  estudio de una o más  muestras representativas.
ESTADÍSTICO.- Conocido también como estadígrafo, es el  valor calculado en base a los datos que se obtienen sobre una muestra y por lo tanto es una estimación de los parámetros. Entre los más usados se tiene la media muestral y la desviación estándar muestral.
ESTIMADOR.- Es un estadístico empleado para estimar un parámetro.
ESTIMADOR INSESGADO.- Es un tipo de estimador que posee la propiedad de que el promedio de las estimaciones efectuadas a partir de todas las muestras posibles de un determinado tamaño es igual al valor verdadero o valor poblacional.
ESTRATIFICACIÓN.- Es un procedimiento por medio del cual una población se divide en grupos llamados estratos, con el propósito de seleccionar una muestra separada en cada grupo. Cada uno de estos grupos o estratos debe ser internamente lo más homogéneo posible.
ESTRATO.- Es una subpoblación o parte de una población que reúne características comunes que le hacen ser homogénea. Los estratos son mutuamente excluyentes. Ello significa que los elementos que pertenecen a un estrato no pueden pertenecer a otro.


F


FACTOR DE EXPANSIÓN. - Es  un número  constante ( factor o multiplicador) por medio del cual el valor de la variable muestral se expande eleva a nivel de la población total. El factor de expansión es el recíproco o inverso de la fracción de muestreo.
FRACTIL O CUANTIL.- Es el valor que se obtiene al fraccionar el conjunto de datos en partes o fracciones iguales. Los más conocidos son:  mediana, cuartiles, deciles y percentiles.
FRECUENCIA ABSOLUTA.- Es el número de veces que la variable asume un valor dado o pertenece a una clase dada.
FRECUENCIA ABSOLUTA ACUMULADA. - Es  el  número d e observaciones hasta (inclusive) un valor dado de una variable numérica. Se representa por Ni.
FRECUENCIA CONJUNTA.- Es un número n que representa l a ocurrencia de dos variables (x, y) en los elementos de población o de la muestra.
FRECUENCIA MARGINAL.- En una distribución conjunta, son las frecuencias de cada una de las variables sin tener en cuenta el valor de la (s) otra (s).
FRECUENCIA RELATIVA.- Es un valor que se obtiene como el cociente de la frecuencia absoluta ( n ) sobre el  tamaño de l a muestra (N).


G 


GRADO DE URBANIZACIÓN.- Es el porcentaje de población que reside en las zonas urbanas (ciudades) de un país, región o lugar. 

       
H 


HIPÓTESIS ESTADÍSTICA.- Es una afirmación respecto a alguna característica de la población en estudio que se formula para ser sometida a la denominada prueba de hipótesis, para ser aceptada o  rechazada.
HISTOGRAMA.- Gráfico utilizado para representar la distribución de frecuencias de una variable continua.

 
I


INDEPENDENCIA ESTADÍSTICA.- Se dice que dos variables X e Y son independientes.
ÍNDICE.- Es la relación expresada en porcentaje entre el precio, cantidad o valor de un bien y servicio o conjunto de bienes y servicios, en un período de estudio y el precio, cantidad o valor del mismo bien y servicio o conjunto de bienes y servicios en el periodo de referencia o período base.


L

LÍMITE INFERIOR.- Es el menor valor de un intervalo de clase. 
LÍMITE SUPERIOR.- Es el mayor valor de un intervalo de clase. 

M
 
MARCA DE CLASE.- Es la denominación que se le da al punto medio de un intervalo  en una tabla de frecuencias de datos agrupados.  Hay tantas marcas de clase como intervalos tenga la variable.
MARCO MUESTRAL.- Es la totalidad de unidades de muestreo de la se selecciona una muestra.
MEDIA ARITMÉTICA PARA DATOS SIMPLES.- Es una medida de tendencia central que denota el promedio de un conjunto de datos.
MEDIA ARITMÉTICA PARA DATOS AGRUPADOS.- Es una medida de tendencia central.  Se calcula multiplicando cada valor de los elementos por el número de veces que se repite.
MEDIANA.- Es una medida de tendencia central.  Es el valor que divide al conjunto de datos ordenados, en aproximadamente dos partes.
MODA.- Es una medida de tendencia central es el valor de la variable que tiene mayor frecuencia absoluta.
MUESTRA.- Es un subconjunto representativo de la población a partir del cual se pretende realizar inferencias respecto a la población de donde procede.
MUESTRA NO PROBABILÍSTICA.- Es aquel l a que se obtiene mediante juicio de la persona que selecciona los elementos de la muestra que usualmente es un experto en la materia.
MUESTRA PROBABILÍSTICA.- Es aquella muestra obtenida por un mecanismo de probabilidades,en el cual cada elemento de la población total o universo ti ene una probabilidad conocida de selección.  MUESTREO.- Es un conjunto de métodos y procedimientos estadísticos destinados a la selección de una o mas muestras  es la técnica seguida para elegir muestras. 
MUESTREO ALEATORIO SIMPLE.- También llamado irrestrictamente aleatorio.
MUESTREO SISTEMÁTICO.- Es una variante del método aleatorio simple de selección de cada elemento de la muestra.
MUESTREO ESTRATIFICADO ALEATORIO.- Es  un método de muestreo que se aplica cuando se divide la población en grupos, llamados estratos.
MUESTREO POR CONGLOMERADOS.- Es un método de muestreo en el  cual  la población está en grupos debido a la organización administrativa u otro (conglomerados). 
MUESTREO CON REPOSICIÓN.- Es el método para obtener una muestra con reposición.  
MUESTREO SIN REPOSICIÓN.- Es el procedimiento para seleccionar cada elemento de la población  éste no se repone o considera de nuevo en la población, por lo que no puede ser seleccionado nuevamente.

N
 
NIVEL DE SIGNIFICACIÓN.- Se define como la probabilidad de rechazar la hipótesis nula cuando ésta es verdadera.

O
 
OJIVA.- Es un gráfico acumulativo de frecuencias o frecuencias relativas. Existen  las ojivas mayor que y menor que. 

P
 
PARÁMETRO.- Es cualquier valor característico de la población.  Ejemplo: la media de la población, la desviación típica de la población.  
PERMUTACIONES.- Son las distintas disposiciones de los elementos en que se pueden ordenar los objetos.
PROBABILIDAD.- Es un número que se le asigna a un suceso como una medida de su incertidumbre. 
POBLACIÓN FINITA.- Es aquella en la que es posible enumerar (contar) físicamente los elementos que pertenecen a la población. 
POBLACIÓN INFINITA.- Es aquella en la que no es posible enumerar (contar) físicamente los elementos que pertenecen a la población. Dicho de otra manera, cuando los elementos de la población son ilimitados. 
POBLACIÓN O UNIVERSO.- Es cualquier conjunto de unidades o elementos claramente definido, en el espacio y el tiempo, donde los elementos pueden ser personas, granjas, hogares, manzanas, condados, escuelas, hospitales, empresas, y cualquier otro.  

Q
 
QUINTIL.- Es un fractil se obtienen dividiendo al conjunto de datos en cinco partes iguales cada parte representa el 20% del total.

R

RANGO.- Conocido también como recorrido, es un número que mide la amplitud de los valores de un conjunto de datos y se calcula por diferencia entre el valor mayor  y el valor menor.
REDONDEO.- Es el procedimiento para expresar un número de acuerdo a una precisión establecida.


SERIES TEMPORALES.- Conocida también como serie cronológica.
Es la sucesión de observaciones cuantitativas ordenadas en el tiempo de un fenómeno.

T

TABLA DE CONTINGENCIA.- Es una tabla de doble entrada. 
TABLA DE DATOS AGRUPADOS.- Es un arreglo matricial que contiene el número de veces (frecuencia) que aparece un dato, de acuerdo a las clases de interés especificadas (puede ser intervalos). (Ver distribución unidimensional) 
TASA.- Es la relación del número de casos, frecuencias o eventos de una categoría entre el número total de observaciones, multiplicada por un múltiplo de 10, generalmente 100 ó 1000. 

U 

UNIDAD DE MUESTREO.- Es la unidad estadística que se selecciona para constituir la muestra.  
UNIDAD ESTADÍSTICA.- Conocido también como unidad elemental.

V

VARIABLE.- Es una característica de la población o de la muestra cuya medida puede cambiar de valor.  Se representa simbólicamente mediante las letras del alfabeto. Según su naturaleza puede ser cualitativa y cuantitativa. 
VARIABLE ALEATORIA.- Conocida también como variable estocástica o probabilística. Es la característica considerada en un experimento aleatorio cuyo valor de ocurrencia sólo puede saberse con exactitud una vez observado. 
VARIABLE BIDIMENSIONAL. - Es aquella que proporciona información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
VARIABLE CONTINUA.- Es  una variable  cuantitativa .Es la característica de la población, cuyos valores están representados mediante el conjunto de los números reales.  Puede tomar cualquier valor real dentro de un intervalo. 
VARIABLE CUALITATIVA.- Es aquel la que representa cualidades, atributos o características no numéricas y estas pueden ser nominales y ordinales. 
VARIABLE CUANTITATIVA.- Es aquella característica de la población o de la muestra que es posible representar numéricamente.  Éstas pueden ser continua y discreta.
VARIABLE DETERMINÍSTICA.- Es aquella cuyo valor puede ser predicho con exactitud. 
VARIABLE DISCRETA.- Es una variable cuantitativa.  Es la característica de la población, cuyos valores están representados mediante el conjunto de los números naturales. Por ejemplo, el número de alumnos de un aula.
VARIANZA.- Conocida también como variancia, es una medida de dispersión de la información.

Comentarios