Las pruebas de hipótesis están estrechamente relacionadas al problema de estimación.
Estimación por intervalos
Supongamos que la variable aleatoria de interes sigue la función de densidad (masa) de probabilidad , pero desconocemos el parámetro .
Es importante observar que partimos de una suposición y él como se llega a esa suposición es un proceso que no está bien formalizado.
Entonces lo que queremos es tener un conjunto de valores al que pertenece con cierto grado certeza.
Sea una muestra aleatoria. Si , puede ser visto de dos maneras: como una variable aleatoria, y es una función de la muestra aleatoria. Además denotemos por un valor de .
Definición. Sean una función real , , una muestra aleatoria de una función de densidad , dos estadísticas tales que y
Un valor de del intervalo aleatorio o el intervalo aleatorio mismo es llamado un intervalo de confianza para .
Notemos que bien puede ser .
A se le llama grado o coeficiente de confianza y es común tomar .
Método pivotal
Definición. Sea una muestra aleatoria de . Sea , es decir es una función de y . Si tiene una distribución que no depende de , entonces es una cantidad pivotal .
Método pivotal. Si es una cantidad pivotal, entonces para cualquier valor fijo existe y que dependen de tales que
Ahora, si para cada posible valor de la muestra ,
para funciones y que no dependen de , entonces es un intervalo de confianza para , donde , .
Los dos pasos en este método son:
1. Encontrar una cantidad pivotal.
2. Invertirla.
Observaciones:
- Como es una función de y , entonces podemos pasar de las desigualdades a , "despejando".
- En la práctica tomamos un estimador puntual para para encontrar la cantidad pivotal. Y nos fijamos en su distribución, si esta depende de , debemos pensar en hacer alguna trasformación o modificar la función.
- Por ejemplo podemos usar la expresión que nos da el Teorema del límite central, para estimar un intervalo de confianza para la media o fijarnos en estimadores puntuales para los cuales se conocemos su distribución.
¿Para cualquier problema existe una cantidad pivotal?
Proposición. Si es una muestra aleatoria de , para la cual la función de distribución acumulada es continua en , entonces
es una cantidad pivotal. Es más, si también monótona en para cada , entonces se puede encontrar un intervalo de confianza para .
Ejemplo
Sean una muestra aleatoria de una distribución normal con varianza 1 y media desconocida.
Consideremos estimar . Resulta que
tiene una distribución normal estandar, y entonces es una cantidad pivotal.
Para un dado existen y tales que
si y sólo si
así es un intervalo de confianza para con coeficiente .
Para minimizar la longitud del intervalo se debe tener .
Así con una tabla de la distribución o usando programación podemos encontrar y .
Algunas definiciones
En la investigación experimental, el objetivo es algunas veces meramente la estimación de paramétros. Por ejemplo comparar la media de una característica de un producto que se ha producido por dos procesos diferentes: un proceso y proceso , entonces en base a los datos queremos saber que media es mayor. Se conoce la media del proceso digamos . Tradicionalmente consideramos la hipótesis que la media del proceso es mayor o menor que , entonces en base a una muestra de la población del proceso veremos si aceptamos o rechazamos la hipótesis.
Definición. Una hipótesis estadística es una afirmación o conjetura sobre la distribución de una o más variables aleatorias. Si la hipótesis estadística determina completamente la distribución, entonces se llama simple, sino se llama compuesta. Y la denotamos por .
Definición. Una prueba de hipótesis estadística es una regla o procedimiento para decidir si rechazar la hipótesis. Y la denotamos por .
Definición. Sea una prueba de una hipótesis . se dice no aleatoria si rechazamos si y sólo si , donde es un subconjunto del espacio muestral, y es llamada la región critica de la prueba .
En la mayoría de problemas dos hipótesis son discutidas. Una es llamada hipótesis nula, denotada por . Y a la segunda hipótesis se llamada hipótesis alternativa, denotada por .
Se piensa que si una de ellas es falsa la otra es verdadera.
Tipos de errores |
cierta |
falsa |
Rechazar |
Error tipo I |
|
No rechazar |
|
Error tipo II |
Tamaño de error.
Definición. Sea una prueba de de la hipótesis . La función de potencia de la prueba , es denotada por es la probabilidad de rechazar cuando la distribución de la muestra es parametrizada por .
Definición. Sea una prueba de de la hipótesis , donde , es decir, es un subconjunto del espacio parametral . El tamaño de la prueba de es definida por . El tamaño de prueba para una prueba no aleatorizada es también referida como el tamaño de la región crítica.
Existen dos problemas como en estimación:
1. Un método para encontrar una prueba.
2. Tener un criterio para comparar pruebas.