La desviación estándar es uno de esos términos estadísticos en el mundo corporativo, que le permite aumentar la credibilidad de las personas que lograron atornillar con éxito durante una conversación o presentación, y deja un vago malentendido de aquellos que no saben qué es, pero les da vergüenza preguntar. De hecho, la mayoría de los gerentes no entienden el concepto de desviación estándar, y si usted es uno de ellos, debe dejar de vivir en una mentira. En el artículo de hoy, le diré cómo esta medida estadística subestimada lo ayudará a comprender mejor los datos con los que está trabajando.
¿Qué mide la desviación estándar?
Imagina que tienes dos tiendas. Y para evitar pérdidas, es importante que exista un control claro de los saldos de existencias. En un intento por descubrir cuál de los gerentes administra mejor el inventario, decidió analizar las existencias de las últimas seis semanas. El costo semanal promedio de existencias para ambas tiendas es aproximadamente el mismo y asciende a aproximadamente 32 unidades convencionales. A primera vista, el valor promedio del flujo muestra que ambos gerentes trabajan de la misma manera.
Pero si estudia cuidadosamente las actividades de la segunda tienda, puede ver que aunque el valor promedio es correcto, la variabilidad del flujo es muy alta (de 10 a 58 pies cúbicos). Por lo tanto, podemos concluir que el valor promedio no siempre evalúa correctamente los datos. Aquí es donde la desviación estándar viene al rescate.
La desviación estándar muestra cómo se distribuyen los valores en relación con el promedio de nuestra muestra. En otras palabras, podemos entender qué tan grande es la extensión del valor de la escorrentía de semana a semana.
En nuestro ejemplo, utilizamos la función STD de Excel para calcular la desviación estándar junto con el promedio.
En el caso del primer administrador, la desviación estándar fue 2. Esto nos dice que cada valor en la muestra en promedio se desvía en 2 del valor promedio. Es bueno? Veamos el problema desde un ángulo diferente: la desviación estándar de 0 nos dice que cada valor en la muestra es igual a su valor promedio (en nuestro caso, 32.2). Entonces, la desviación estándar de 2 no es muy diferente de 0, e indica que la mayoría de los valores están cerca del valor promedio. Cuanto más cercana sea la desviación estándar a 0, más confiable será el promedio. Además, la desviación estándar cercana a 0 indica una pequeña variabilidad de datos. Es decir, el caudal con una desviación estándar de 2 indica una secuencia increíble del primer administrador.
En el caso de la segunda tienda, la desviación estándar fue de 18,9. Es decir, el costo de la escorrentía se desvía en promedio en 18.9 del valor promedio de una semana a otra. Dispersión loca! Cuanto más lejos esté la desviación estándar de 0, menos preciso será el valor promedio. En nuestro caso, la cifra de 18.9 indica que no se puede confiar en el valor promedio (32.8 pies cúbicos por semana). También nos dice que la escorrentía semanal es muy variable.
Este es el concepto de desviación estándar en pocas palabras. Aunque no proporciona una idea de otras mediciones estadísticas importantes (Moda, Mediana ...), de hecho, la desviación estándar juega un papel decisivo en la mayoría de los cálculos estadísticos. Comprender los principios de la desviación estándar arrojará luz sobre la esencia de muchos procesos en su negocio.
¿Cómo calcular la desviación estándar?
Entonces, ahora sabemos lo que dice la cifra de desviación estándar. Veamos cómo se considera.
Considere un conjunto de datos de 10 a 70 en pasos de 10. Como puede ver, ya he calculado la desviación estándar para ellos utilizando la función STANDOTLON en la celda H2 (naranja).
Los pasos que Excel toma para llegar a 21.6 se describen a continuación.
Tenga en cuenta que todos los cálculos se visualizan para una mejor comprensión. De hecho, Excel calcula al instante, dejando todos los pasos detrás de escena.
Primero, Excel encuentra el valor promedio de la muestra. En nuestro caso, el promedio resultó ser 40, que en el siguiente paso se resta de cada valor de muestra. Cada diferencia obtenida es al cuadrado y se resume. Obtuvimos una suma igual a 2800, que debe dividirse por el número de elementos de muestra menos 1. Como tenemos 7 elementos, resulta que necesitamos dividir 2800 por 6. Del resultado encontramos la raíz cuadrada, esta cifra será la desviación estándar.
Para aquellos que no tienen del todo claro el principio de calcular la desviación estándar utilizando la visualización, les doy una interpretación matemática de encontrar este valor.
Funciones de cálculo de desviación estándar de Excel
Excel tiene varias variedades de fórmulas de desviación estándar. Solo necesita marcar = STANDOTLON y lo verá por usted mismo.
Vale la pena señalar que las funciones STANDOTCLON.V y STANDOTKLON.G (la primera y segunda funciones en la lista) duplican las funciones STANDOTLON y STANDOTCLONP (la quinta y sexta funciones en la lista), respectivamente, que se dejaron para compatibilidad con versiones anteriores de Excel.
En general, la diferencia en las terminaciones de las funciones .B y .G indica el principio de calcular la desviación estándar de la muestra o la población. Ya expliqué la diferencia entre estas dos matrices en el artículo anterior del cálculo de dispersión.
Una característica de las funciones STANDOTLON y STDOTLONP (las funciones tercera y cuarta de la lista) es que al calcular la desviación estándar de la matriz, se tienen en cuenta los valores lógicos y de texto. Los valores lógicos textuales y verdaderos son iguales a 1, y los valores lógicos falsos son iguales a 0. Me resulta difícil imaginar una situación en la que pueda necesitar estas dos funciones, por lo tanto, creo que pueden ignorarse.
28 comentarios
Renat, buenas tardes.
Me gusta el artículo, y lo más importante, la forma en que se presenta el material. La visualización del cálculo también agradó la novedad del enfoque, aunque también requirió más tiempo para la comprensión (educación soviética clásica). Estoy de acuerdo en que nadie sabe realmente sobre la desviación estándar, pero en vano ...
Buenas tardes
Hay un error en la fórmula: bajo el signo de la raíz, es necesario sumar las desviaciones al cuadrado
Determinación de desviación estándar
Determine de inmediato cuál es la desviación estándar y cómo se ve su fórmula. Este valor es la raíz cuadrada de la media aritmética de los cuadrados de la diferencia de todos los valores de la serie y su media aritmética. Hay un nombre idéntico para este indicador: desviación estándar. Ambos nombres son completamente equivalentes.
Pero, naturalmente, en Excel, el usuario no tiene que calcular esto, ya que el programa hace todo por él. Veamos cómo calcular la desviación estándar en Excel.
Método 1: Asistente de funciones
- Seleccione la celda en la hoja donde se mostrará el resultado final. Haga clic en el botón "Insertar función"ubicado a la izquierda de la línea de función.
En la lista que se abre, busque la entrada STANDOTLON.V o STANDOTLON.G. También hay una función en la lista STD, pero queda de versiones anteriores de Excel para fines de compatibilidad. Después de seleccionar el registro, haga clic en el botón Ok.
Método 2: pestaña Fórmulas
También puede calcular el valor de la desviación estándar a través de la pestaña "Fórmulas".
- Seleccione la celda para mostrar el resultado y vaya a la pestaña "Fórmulas".
Método 3: ingrese manualmente la fórmula
También hay una forma en la que no es necesario llamar a la ventana de argumento en absoluto. Para hacer esto, ingrese la fórmula manualmente.
- Seleccione la celda para mostrar el resultado y prescriba en ella o en la barra de fórmulas la expresión de acuerdo con el siguiente patrón:
= STANDOTLON.G (número1 (dirección_célula1), número2 (dirección_célula2), ...)
o
= STDB.V (número1 (dirección_célula1), número2 (dirección_célula2), ...).
En total, se pueden escribir hasta 255 argumentos si es necesario.
Como puede ver, el mecanismo para calcular la desviación estándar en Excel es muy simple. El usuario solo necesita ingresar números de la población o un enlace a las celdas que los contienen. Todos los cálculos son realizados por el propio programa. Es mucho más difícil darse cuenta de qué es el indicador calculado y cómo se pueden aplicar los resultados del cálculo en la práctica. Pero la comprensión de esto ya se relaciona más con el campo de la estadística que con la capacitación para trabajar con software.
Gracias al autor, comparte el artículo en las redes sociales.
Valor máximo y mínimo
Comencemos con las fórmulas máxima y mínima. Máximo es el valor más grande del conjunto de datos analizados; el mínimo es el más pequeño. Estos son valores extremos en el conjunto de datos que indican los límites de su variación. Por ejemplo, precios mínimos / máximos para algo, elegir la mejor o la peor solución a un problema, etc.
Hay funciones especiales para calcular estos indicadores: MAX y MIN en consecuencia El acceso es directamente desde la cinta, en la lista desplegable de avosumma.
Si utiliza la inserción de funciones, debe pasar a la categoría "Estadística".
En general, para llamar a la función de acciones máximas o mínimas no se requerirá más que calcular la media aritmética.
Desviación lineal media
La desviación lineal promedio es el promedio de las desviaciones absolutas (módulo) de la media aritmética en el conjunto de datos analizados. La fórmula matemática tiene la forma:
un - desviación lineal media,
X - indicador analizado,
X̅ - el valor medio del indicador,
n - el número de valores en el conjunto de datos analizados.
En Excel, esta función se llama PROMEDIO.
Después de seleccionar la función PROMEDIO, indique el rango de datos sobre el cual debe realizarse el cálculo. Haz clic en Aceptar.
Quizás no todos sepan qué es una varianza de una variable aleatoria, así que explicaré: esta es una medida de la propagación de datos en torno a la expectativa matemática. Sin embargo, generalmente solo hay una muestra disponible, por lo que se utiliza la siguiente fórmula de dispersión:
s 2 - varianza muestral calculada a partir de datos de observación,
X - valores individuales
X̅- media aritmética de la muestra,
n - el número de valores en el conjunto de datos analizados.
La función de Excel correspondiente es DISP.G. Al analizar muestras relativamente pequeñas (hasta aproximadamente 30 observaciones), se debe usar una varianza de muestra imparcial, que se calcula utilizando la siguiente fórmula.
La diferencia, como se puede ver, está solo en el denominador. Excel tiene una función para calcular la varianza imparcial de la muestra DISP.V.
Seleccionamos la opción deseada (general o selectiva), indicamos el rango, hacemos clic en el botón "Aceptar". El valor resultante puede llegar a ser muy grande debido a la cuadratura preliminar de las desviaciones. La dispersión en las estadísticas es un indicador muy importante, pero generalmente no se usa en su forma pura, sino para cálculos posteriores.
Desviacion estandar
La desviación estándar (RMS) es la raíz de la varianza. Este indicador también se denomina desviación estándar y se calcula mediante la fórmula:
por población
Simplemente puede extraer la raíz de la varianza, pero en Excel hay funciones listas para la desviación estándar: STANDOTLON.G y STANDOTLON.V (según el agregado general y de muestra, respectivamente).
Repito, el estándar y la desviación estándar son sinónimos.
Luego, como de costumbre, especifique el rango deseado y haga clic en "Aceptar". La desviación estándar tiene las mismas unidades de medida que el indicador analizado, por lo tanto, es comparable con los datos de origen. Sobre esto a continuación.
Coeficiente de variación
Todos los indicadores discutidos anteriormente están vinculados a la escala de los datos fuente y no permiten obtener una idea figurativa de la variación de la población analizada. Para obtener una medida relativa de uso de dispersión de datos coeficiente de variacióncalculado dividiendo desviación estándar en media aritmética. La fórmula para el coeficiente de variación es simple:
No existe una función preparada para calcular el coeficiente de variación en Excel, lo cual no es un gran problema. El cálculo se puede hacer simplemente dividiendo la desviación estándar por el valor promedio. Para hacer esto, escriba en la barra de fórmulas:
Un rango de datos se indica entre paréntesis. Si es necesario, use la desviación estándar de la muestra (STD. B).
El coeficiente de variación generalmente se expresa como un porcentaje, por lo que una celda con una fórmula se puede enmarcar en un formato de porcentaje. El botón deseado se encuentra en la cinta en la pestaña "Inicio":
También puede cambiar el formato seleccionando "Formatear celdas" en el menú contextual después de seleccionar la celda deseada y hacer clic derecho.
El coeficiente de variación, a diferencia de otros indicadores de la dispersión de valores, se utiliza como un indicador independiente y muy informativo de la variación de datos. En estadística, generalmente se acepta que si el coeficiente de variación es inferior al 33%, el conjunto de datos es homogéneo, si es superior al 33%, entonces es heterogéneo. Esta información puede ser útil para una descripción preliminar de los datos y para determinar las posibilidades de un análisis posterior. Además, el coeficiente de variación, medido en porcentaje, le permite comparar el grado de dispersión de varios datos, independientemente de su escala y unidades. Propiedad útil
Coeficiente de oscilación
Otro indicador de la dispersión de datos hoy es el coeficiente de oscilación. Esta es la relación del rango de variación (la diferencia entre el valor máximo y mínimo) al promedio. No hay una fórmula Excel lista para usar, por lo que debe reunir tres funciones: MAX, MIN, AVERAGE.
El coeficiente de oscilación muestra el grado de variación en relación con el promedio, que también se puede utilizar para comparar diferentes conjuntos de datos.
En general, usando Excel, muchas estadísticas se calculan de manera muy simple. Si algo no está claro, siempre puede usar la ventana para buscar en la inserción de función. Bueno, Google para ayudar.