Sesiones Temáticas

Análisis Multivariado

Análisis Multivariado

Jueves 22 de Septiembre
Aula 9, 16:00 - 16:55
16:00 - 16:25

Comparación de métodos de reducción de dimensión para predecir sobrevivencia

Elizabeth González Estrada, ISEI, Colegio de Postgraduados
Javier Rojo, Rice University, USA

En esta presentación se discuten los resultados de un estudio de simulación en el que se comparan procedimientos de dos etapas para predecir el tiempo de sobrevivencia a enfermedades usando datos de microarreglos, en los cuales se tienen mediciones sobre niveles de expresión genética de un número de genes mucho mayor que el número de pacientes bajo estudio. En la primera etapa de cada procedimiento se reduce la dimensión del conjunto de datos usando matrices aleatorias de Achlioptas y con entradas iid normal estándar, y el método de componentes principales. En la segunda etapa, las variables del conjunto de datos reducido son introducidas como covariables en el modelo de riesgos proporcionales de Cox para predecir el tiempo de sobrevivencia. Los criterios de comparación usados son el error cuadrado medio de los pesos asignados a las covariables, el error cuadrado medio de la función de sobrevivencia estimada usando el promedio de las covariables y el error cuadrado medio de la función de sobrevivencia estimada usando las covariables correspondientes a los individuos.

16:30 – 16:55

Comparación de técnicas de minería de datos y componentes principales: El modelo de árboles de decisión

Juan Carlos Medina Martínez, Lorena Alonso Guzmán y León Julio Cortez Organista
Unidad Académica de Ingeniería, Universidad Autónoma de Guerrero

En esta investigación se presenta un comparativo de técnicas de manejo de datos aplicadas a la búsqueda de patrones para determinar el patrón espacial del maguey papalote, se destaca el uso de minería de datos como técnica de análisis de datos, ya que permite con la construcción de redes de interacción biótica representar una herramienta potente que permita predecir factores para la producción y declinamiento del maguey papalote; otra técnica es el Análisis de Componentes Principales, la cuál es una técnica en estadística multivariada muy utilizada para reducir variables sin la perdida de información; para el desarrollo de estas técnicas se utiliza los resultados de la investigación, ``Desarrollo de un Sistema de Inventario y Monitoreo de Maguey Papalote (Agave cupreata Trel et Berger)", (SIMMP), para conocer patrones ambientales que nos indiquen la etapa a labrar de la planta y con esto a conservar el maguey papalote en el Estado de Guerrero.

Cómputo/Software Estadístico

Cómputo/Software Estadístico

Jueves 22 de septiembre
Aula Magna (16:00 - 16:55)
16:00 – 16:25

Paquete R para estimación de densidades y clasificación

Luis E. Nieto Barajas y Ernesto Barrios
Depto de Estadística, ITAM
Igor Pruenster, University of Turin

En esta plática se presenta la implementación en R de un modelo para estimación de densidades. El modelo se basa en la inferencia Bayesianas no paramétrica y en particular en mezclas de procesos de incrementos independientes normalizados. Se dará énfasis en el uso del paquete y la interpretación de resultados.

16:30 – 16:55

Desarrollo de un módulo de pruebas de Estadística No Paramétrica con Java y R

Francisco Javier Landa Torres, Sergio Hernández González, Genaro Rebolledo Méndez y Nery Sofía Huerta Pacheco
Facultad de Estadística e Informática, Universidad Veracruzana

En este trabajo se propone el desarrollo de un módulo codificado en Java para realizar pruebas de Estadística no Paramétrica, obteniendo las funciones estadísticas correspondientes del paquete R. Los objetivos principales para desarrollar el módulo son: 1) obtener un recurso gráfico para procesar un conjunto de información con herramientas de Estadísticas No Paramétricas, 2) procesar la información con mayor eficiencia en memoria con la ayuda del recolector de basura y 3) obtener una herramienta que sea independiente de la plataforma. Este modulo se desarrolla bajo la metodología de modelo de desarrollo en espiral debido a su avance de forma iterativa y creciente. La creación de este módulo propone la implementación de un sistema libre integrado por todos los métodos de Estadística no Paramétrica.

Diseños de Experimentos

Diseños de Experimentos

Miércoles 21 de septiembre
Aula Magna (13:05 - 14:00)
13:05 – 13:30

Uso de transformaciones para probar interacción en experimentos factoriales con variable respuesta Poisson

Gustavo Ramírez-Valverde, ISEI, Colegio de Postgraduados
Benito Ramírez-Valverde, Colegio de Postgraduados

Experimentos con variable respuesta Poisson son frecuentes. Siendo la variable respuesta Poisson, entonces se violan los supuestos del ANOVA. Para solucionar el problema se usan transformaciónes. Otra alternativa es el modelo lineal generalizado con distribución Poisson y función liga logarítmica, el modelo cumple con los supuesto distribucional, sin embargo, el análisis se basa en máxima verosimilitud y en pruebas asintóticas; en los diseños experimentales típicamente se tiene muestras pequeñas, por lo que es necesario explorar su comportamiento con muestras pequeñas. En este trabajo, con un estudio de simulación se compara la potencia y el tamaño de la prueba para probar interacción en un factorial con dos factores utilizando: a) ANOVA b) ANOVA con transformaciones, y c) Modelo Lineal generalizado con función de liga logarítmica.

13:35 - 14:00

Eficiencia relativa y post-análisis de los diseños experimentales en caña de azúcar

Juan Ruiz Ramírez, Fac. de Economía, Universidad Veracruzana
Luis Cruz Kuri, Fac. de Ciencias Administrativas y Sociales, Universidad Veracruzana
Bertha Alicia Arce Castro, Fac. de Ciencias Admvas y Sociales, Universidad Veracruzana
Agustín Jaime García Banda, Universidad Veracruzana
Ismael Sosa Galindo, Fac de Ciencias Admvas y Sociales, Universidad Veracruzana

En la experimentación agrícola, comúnmente se utiliza el diseño de bloques al azar (DBA) y no se calcula la eficiencia relativa (ER) y por consecuencia, no se realiza el post-análisis con el diseño completamente al azar (DCA) cuando es requerido. Es por ello que se plantea el siguiente objetivo: "Calcular la ER del DBA vs. el DCA al azar y realizar el post-análisis estadístico". Para ello se analizaron 12 experimentos de fertilización en caña de azúcar con el SAS y se calculó la ER con el software "Eficiencia Relativa". Se obtuvo que el 42% de ellos aplicaron el DBA de manera incorrecta, por lo que se tuvieron que post-analizar con el DCA, obteniéndose valores de probabilidad (p-values) y CV, menores o iguales a los del DBA. Se concluye que es importante calcular la ER y así obtener resultados de investigación confiables.

Estadística Bayesiana

Estadística Bayesiana

Viernes 23 de septiembre
Aula Magna (10:00 - 13:00)
10:00 – 10:25

Familias exponenciales y distribuciones iniciales

Manuel Mendoza Ramírez, Depto. de Estadística, ITAM
Eduardo Gutiérrez Peña, Depto. Probabilidad y Estadística, IIMAS-UNAM

Las familias exponenciales de distribuciones han sido ampliamente estudiadas en la literatura pero siguen ofreciendo un campo fértil para la investigación. En este trabajo se examina este tipo de modelos desde la perspectiva de optimización. Se muestra como, cuando se considera una medida de información específica, estos modelos pueden considerarse una solución apropiada para describir fenómenos aleatorios. En una dirección relacionada, también se muestra que, con un argumento similar, se justifica el empleo de distribuciones conjugadas para el análisis Bayesiano y como se pueden inducir distribuciones iniciales no informativas.

10:30 – 10:55

Análisis bayesiano y modelos demográficos

Alejandro Alegría Hernández, UMIE, Facultad Latinoamericana de Ciencias Sociales

El propósito del presente trabajo es aplicar los métodos bayesianos para estudiar el comportamiento de variables demográficas, tales como tasas de mortalidad, natalidad, etc. y realizar los pronósticos correspondientes. La metodología bayesiana permite tratar el caso de observaciones faltantes sin mayor problema, lo cual es importante cuando se trabaja con estadísticas vitales de países que tienen registros incompletos o poco confiables. También es posible considerar variabilidad no constante para diferentes grupos de edad. En esta plática se presentan algunos modelos usados en demografía y el análisis bayesiano de los mismos.

11:00 – 11:25

Meta-análisis usando modelos jerárquicos bayesianos

Juan Diego Hernández Jarquín, COLPOS, CIMMYT - CRIL
Sergio Pérez Elizalde, COLPOS, CIMMYT - CRIL
Jose Luis Crossa Hiriart, CIMMYT - CRIL

En el análisis de la interacción de tablas de doble entrada ha sido difícil estimar los parámetros de interacción, además en el contexto de los experimentos de plant breeding existe la necesidad de incorporar información disponible para el análisis de la interacción GxE y de los efectos lineales. Se propone el modelo Jerárquico Bayesiano para la realización del meta análisis, usando el muestreador de Gibbs se ahorra tiempo computacional y se hace estable el algoritmo. Datos de experimentos de maíz en multi-ambientes (CIMMYT) de dos años consecutivos (2009 y 2010). La distribución von Mises-Fisher fue usada como a priori para el estudio de la interacción GE, y la incorporación de información se utilizo para estimar los parámetros lineales y bilineales. Los resultados muestran que usando el modelo propuesto se obtiene mejores estimaciones lo cual se refleja en un encogimiento (shrinkage).

12:05 – 12:30

Distribución geográfica de la mortalidad por tumor mclasso de la mama y cervicouterino en el Estado de México: 2005-2009

Miguel Ángel López Díaz, Enrique Castañeda Alvarado y Fernando Orozco Zitli
Facultad de Ciencias, UAEMex

En estudios epidemiológicos el empleo de mapas para representar la distribución geográfica de enfermedades o decesos permite generar hipótesis acerca de las posibles causas en la variación del riesgo relativo así como la identificación de clústers. Los enfoques tradicionales para la construcción de mapas de mortalidad se basan en la categorización de la distribución de las tasas de mortalidad estandarizadas. Sin embargo, estos enfoques no permiten estimar a la distribución de probabilidad subyacente. Recientemente, los modelos de mezclas finitas ofrecen una herramienta, simple y efectiva, para determinar clústers. En este trabajo se presentan dos métodos estadísticos Bayesianos que permiten construir mapas de mortalidad considerando la dependencia espacial. Los métodos son comparados a través del análisis de la mortalidad por cáncer de mama y cérvicouterino en el Estado de México entre los años 2005 y 2009. Al final de la plática también se presentan los clusters de mortalidad más elevada empleando técnicas como el Templado Simulado

12:35 – 13:00

Estimación de una tabla de mortalidad regionalizada

Miguel Medina Pinto y Jorge A. Argáez Sosa
Facultad de Matemáticas, Universidad Autónoma de Yucatán

Las tablas de mortalidad son la herramienta principal para el cálculo del costo de un seguro de vida. En México se encuentran en vigor las Tablas CNSF 2000-I y 2000-G. Sin embargo, una pregunta es: ¿Por qué debe usarse la misma tabla para calcular el costo de un seguro de vida en cualquier parte del país, cuando las condiciones de vida no son homogéneas? En este trabajo se estudia el comportamiento de la tasa de mortalidad para la zona de la península de Yucatán. Asimismo, se presenta una manera para estimar la tabla de vida correspondiente utilizando para ello el enfoque de estadística Bayesiana. Finalmente, se discute cómo, usando la forma de modelar que se propone, se pueden obtener tablas de mortalidad para diferentes escenarios que reflejen comportamientos diferentes de la tasa de mortalidad.

Estadística y Ciencias Sociales

Estadística y Ciencias Sociales

Miércoles 21 de septiembre
Aula Magna (12:05 - 13:00)
12:05 – 12:30

Modelo de ecuaciones estructurales para determinar las causas que afectan el rendimiento académico en estudiantes de bachillerato

Ramón Reyes Carreto, Francisco Julián Ariza Hernández y Flaviano Godínez Jaimes
Unidad Académica de Matemáticas, Universidad Autónoma de Guerrero

El mejoramiento de la calidad académica usa como estrategia la evaluación del rendimiento del alumno. Diversos estudios enfatizan que el rendimiento está determinado por factores personales y contextuales. Este trabajo analiza factores socioeconómicos, institucionales, motivacionales, aptitudinales y rendimiento académico de alumnos de bachillerato para identificar relaciones causales. Se utilizan indicadores de trayectoria escolar del bachillerato e información del Ceneval. Se aplica un modelo de ecuaciones estructurales para mejor comprensión de la complejidad de las relaciones causales entre los factores. Se concluye que el factor aptitudinal influye significativamente sobre el factor rendimiento; el factor motivacional influye sobre el factor aptitudinal; y el factor motivacional también tiene efecto significativo sobre el rendimiento.

12:35 – 13:00

Estados afectivos observables durante una situación de aprendizaje

Nery Sofía Huerta Pacheco, Genaro Rebolledo Méndez, Sergio Hernández González y Francisco Javier Landa Torres
Facultad de Estadística e Informática, Universidad Veracruzana

Este trabajo presenta la adaptación de una metodología de observación para la detección de estados afectivos. Los estados afectivos de interés son aquellos que suceden durante una situación de aprendizaje con tecnología. El estudio reportado se realizó a estudiantes de la Licenciatura de Informática de la Universidad Veracruzana, donde se constató un incremento considerable del acuerdo entre dos observadores utilizando los Índices de Kappa. Todo esto con el fin de identificar si las observaciones que se utilizaron son suficientes y representativas de los estados afectivos que se presentaron durante la interacción de los estudiantes con un software educativo, para así reconocer que estados afectivos son conducentes a mayores ganancias de aprendizaje.

Estadística y Medio Ambiente

Estadística y Medio Ambiente

Viernes 23 de septiembre
Auditorio (10:00 - 13:00)
10:00 – 10:25

Explotación de registros administrativos sobre el medio ambiente

Elizabeth Amézquita Muñoz
INEGI/DGGMA/DGARNMA/Dirección de Estadísticas Ambientales/subdirección de explotación de registros administrativos

Es conocido que las unidades del sector público y privado, dentro de sus actividades de gestión y fiscalización interna, llevan registros con el fin de tener elementos para sus procesos de evaluación y contabilidad. Sin embargo, hasta ahora, México no cuenta con un sistema de registros administrativos ambientales organizado, actualizado y articulado, por lo que se ha identificado como una fuente alterna de información, que bajo ciertos parámetros puede considerarse como información estadística. Proyecto de Explotación de Registros Administrativos sobre el Medio Ambiente Establecer, en conjunto con las Unidades de Estado, un Sistema Nacional de Registros Administrativos sobre el Medio Ambiente, como instrumento estándar para el aprovechamiento de registros administrativos y la generación de estadísticas, básicas y derivadas, que describan el estado y las tendencias del medio ambiente en nuestro país.

Relevancia estadística de los Registros Administrativos

En el desarrollo de los Registros Administrativos es preciso tener en cuenta:

  • La existencia de Marco Jurídico o Legislación como sustento a la Unidad de Estado para generar el RA.
  • Cobertura temática y geográfica.
  • Proceso de captación de datos, aplicación de nuevas tecnologías, su procesamiento e integración de resultados.

10:30 – 10:55

Óptimos forestales y captura de carbono: caso Balancán, Tabasco

Plácido Salomón Álvarez López, DICEA, Universidad Autónoma Chapingo
Víctor Rafael Valdovinos Chávez, Universidad Autónoma Chapingo

En la presente investigación se determinó la relación de cinco tipos de óptimos forestales: dos técnicos (máxima producción total y máxima producción media), dos económicos (Hotelling y Faustman) y un ambiental (Hartman), para tres modelos de crecimiento: polinomial, Schumacher y Chapman-Richards. Los datos referentes a la plantación fueron proporcionados por la empresa “PROPLANSE”, para dos especies tropicales: Eucalyptus grandis y Gmelina arborea. Al comparar el óptimo ambiental con los económicos, se encontró que al incorporar aspectos ambientales el turno registró un incremento de 2.5 hasta 9.9 meses para E. grandis, y de 1 hasta 23.4 meses para G. arbórea. En términos generales, el óptimo de Hartman es la opción más adecuada para un aprovechamiento forestal sustentable, debido a que incorpora los aspectos económicos y, los servicios ambientales y recreativos de la plantación.

11:00 - 11: 25

Calidad de plantas forestales en el parque nacional Gral. Juan Álvarez, en el estado de Guerrero

Lorena Alonso Guzmán, Unidad Académica de Ingeniería, UAGro
Alfredo Méndez Bahena, Unidad Académica de Ciencias Químicas Biológicas, UAGro
Juan Carlos Medina Martínez, Unidad Académica de Ingeniería, UAGro

Los Estudios de Impacto Ambiental suelen identificar áreas que deberán ser preservadas y otras que por su sensibilidad o riesgo, deben tener algún manejo específico; como así también, algunas en las que se deben aplicar medidas de mitigación o corrección. Este proyecto tiene por objetivo conocer la calidad morfológica de la especie arbórea del Parque Nacional Gral. Juan Álvarez, en el Estado de Guerrero. El área contaba con la cubierta vegetal de la formación boscosa para denominarse parque descrita para la zona, hoy presenta una cobertura vegetal moderada a pobre, y por la cantidad, altura y diversidad no constituye un bosque, sin embargo, se sugiere pensar en alguna medida compensatoria por pérdida de cubierta vegetal, considerando para esta acción, por medio de un análisis de estadístico multivariado, determinar que especies arbóreas, a fin de evitar su deterioro y modificar políticas, planes y estrategias de carácter económico social.

12:05 – 12:30

Modelo para estimar el riesgo de inundaciones en la cuenca Grijalva Usumacinta

Ana Laura Reyes Olvera, ISEI, Colegio de Postgraduados
Eduardo Gutiérrez González, SEPI-IPN

Se estudia bajo la teoría de valores extremos las precipitaciones de lluvia de la región hidrológica de la cuenca Grijalva Usumacinta en la zona de Tabasco, proponiendo una medición estadística con sus intervalos de confianza para estimar el nivel de retorno y su periodo de retorno asociado. Se propone un modelo estadístico basado en la exposición, vulnerabilidad y sus indicadores, para estimar el riesgo de inundaciones global y por municipio.

12:35 – 13:00

Estimación de la densidad bivariada bajo el enfoque bayesiano no paramétrico

Gladys Linares Fleites, Miguel Ángel Valera Pérez y Maribel Castillo Morales
Instituto de Ciencias, Benemérita Universidad Autónoma de Puebla

La estadística bayesiana no paramétrica brinda nuevas posibilidades a los investigadores de las Ciencias Ambientales, permitiendo la estimación bivariada de la densidad del Carbono según regímenes de humedad y temperatura de los suelos. El Carbono Orgánico del Suelo (COS) es uno de los componentes fundamentales en el estudio del Secuestro de Carbono, una de las formas de mitigación del Cambio Climático. Es conocido que parámetros climáticos tales como la temperatura y la precipitación se encuentran fuertemente ligados al contenido del COS. Utilizando el paquete DPpagkage en R se desarrolló la inferencia bayesiana vía simulación de la distribución posterior bivariada del carbono con la temperatura y con la precipitación, considerando mezclas del Proceso de Dirichlet para la distribución inicial y se obtuvieron gráficos e información predictiva de gran utilidad para la toma de decisiones sobre el almacenamiento de carbono en suelos de la región Teziutlán, Puebla, México.

Estadística y Salud Pública

Estadística y Salud Pública

Miércoles 21 de septiembre
Aula Magna (16:00 - 17:25)

16:00 – 16:25

Desempeño escolar y "bullying" en escuelas de educación media superior

Belem Trejo Valdivia y Airaín Montoya Rodríguez
Evaluación de Programas y Bioestadística, Instituto Nacional de Salud Pública

El bajo rendimiento escolar es un problema en México y se requiere identificar los factores que lo determinan. Se ha reportado un aumento en la frecuencia y gravedad del bullying (manifestación de violencia) así como su íntima relación con el desempeño escolar. No hay estudios en México sobre esta asociación. Se analizó la información de la 2ª Encuesta Nacional sobre Exclusión, Intolerancia y Violencia en las Escuelas de Educación Media Superior, para identificar y evaluar los principales patrones de asociación entre el desempeño escolar y el bullying, considerando factores individuales/familiares/escolares. El enfoque fue por ecuaciones estructurales para determinar la relevancia de asociaciones directas e indirectas entre el promedio escolar y bullying, junto con sexo, edad, nivel socioeconómico, autoestima, percepción del ambiente escolar, etc.

16:30 – 16:55

Aplicación de tratamientos de amplio espectro para una población mixta

Marisol López Cerino y José Del Carmen Jiménez Hernández
Instituto de Física y Matemáticas, Universidad Tecnológica de la Mixteca

Las migraciones están estrechamente relacionadas con el desarrollo de las enfermedades del tipo infeccioso, entre las que se encuentran las parasitosis intestinal (huéspedes invasores). El inmigrante es considerado como un foco potencial para el desarrollo de las mismas, ya sea por las infecciones que trae consigo desde su lugar de origen o por las condiciones de vida en la ciudad receptora que puede favorecer el desarrollo de dichas infecciones. Se realizó un estudio para determinar la prevalencia de los huéspedes invasores en una muestra de inmigrantes del estado de Oaxaca. Se entrevistaron 30 personas y se le administró un tratamiento de amplio espectro. El estudio fue de tipo caso-control encontrando que el parásito intestinal más común es Entamoeba Histolytica que se encuentra entre las diez infecciones más comunes reportadas por el IMSS.

17:00 – 17:25

Métodos estocásticos para determinar la región de rechazo de pruebas clínicas de no inferioridad

Iván Pérez Laguna, ISEI, Colegio de Postgraduados
Gabriel A. Rodríguez Yam, Universidad Autónoma Chapingo
Javier Suarez Espinoza, ISEI, Colegio de Postgraduados

Las pruebas exactas de no inferioridad están diseñadas para averiguar si un tratamiento experimental no es “muy inferior” a un control dentro de un margen de no inferioridad. Dicho margen es usualmente pequeño, conocido y fijo. Excepto cuando la región de rechazo cumple con la condición de convexidad de Barnard, la construcción de la región de rechazo de estas pruebas es computacionalmente intensivo. La condición de convexidad de Barnard es a veces, sólo verificable numéricamente, limitando así el uso de algunos estadísticos de prueba propuestos en la literatura. En este trabajo se implementará un método de optimización estocástico para encontrar la región de rechazo de estas pruebas, que como se notará, no exige que la región de rechazo cumpla la condición de convexidad de Barnard.

Muestreo 1

Muestreo 1

Miércoles 21 de septiembre
Aula 9 (16:00 - 17:25)
16:00 – 16:25

Una cota para el sesgo relativo del efecto del diseño

Alberto Manuel Padilla Terán, Banco de México, Planeación y Programación de Emisión

El estimador del efecto del diseño, Kish (1965), se emplea comúnmente en los diseños muestrales complejos para el cálculo del tamaño de muestra, así como para la construcción de intervalos de confianza, entre otros usos. En este trabajo se muestra que dicho estimador es sesgado y se exhiben, tanto el sesgo del estimador, como una cota para el sesgo relativo. Se ilustrará con algunos ejemplos la magnitud del sesgo y del sesgo relativo.

16:30 – 16:55

Determinación del parámetro de suavizamiento de regresión por splines penalizados en muestreo de poblaciones finitas

Luis Fernando Contreras Cruz, ISEI, Colegio de Postgraduados
José Elías Rodríguez Muñoz, Depto. de Matemáticas, Universidad de Guanajuato
Javier Suárez Espinosa, ISEI, Colegio de Postgraduados

Proponemos una forma de obtener el parámetro de suavizamiento en splines penalizados en el contexto de muestreo de poblaciones finitas. Dicho parámetro se obtiene fijando el número equivalente de parámetros o grados de libertad y resolviendo una igualdad para el parámetro de suavizamiento basado en la información de una muestra. Se hizo un estudio de simulación para ver el comportamiento empírico de la determinación del parámetro de suavizamiento. Además, con una población real se observó el efecto que tiene la determinación del parámetro de suavizamiento propuesto en la estimación del total poblacional. Para la población real, hay evidencia empírica de que el parámetro de suavizamiento propuesto produce un error relativo de estimación similar al que se obtendría determinando dicho parámetro con toda la información auxiliar de la población.

17:00 – 17:25

Coeficiente de determinación para la regresión polinomial local en el muestreo de poblaciones finitas

José Elías Rodríguez Muñoz, Depto. de Matemáticas, Universidad de Guanajuato
Luis Alejandro Escobar López, Universidad Autónoma de Aguascalientes

Para valorar si un modelo estimado es adecuado, se requiere de una medida de la bondad de ajuste. Una medida de esta bondad de ajuste para los modelos de regresión está dada por el coeficiente de determinación. Para la regresión polinomial local existe en la literatura y en un contexto general una propuesta para estimar dicho coeficiente de determinación. En este trabajo proponemos una forma de estimar el coeficiente de determinación para la regresión polinomial local en el contexto de muestreo de poblaciones finitas. La propuesta contempla la estimación del coeficiente a nivel global y local. Además las características de este estimador se muestran a través de algunos experimentos de simulación sobre poblaciones artificiales y reales.

Muestreo 2

Muestreo 2

Jueves 22 de septiembre
Auditorio (17:35 - 19:00)
17:35 – 18:00

Estimación de totales y medias en el muestreo por bola de nieve y en presencia de probabilidades de ligas heterogéneas y asociadas con la variable respuesta

Martin Humberto Félix Medina
Facultad de Ciencias Físico-Matemáticas, Universidad Autónoma de Sinaloa

Se presentan estimadores tipo Horvitz-Thompson del total y la media de los valores de una variable respuesta asociados con los elementos de una población de difícil detección muestreada mediante la variante del muestreo por bola de nieve propuesta por Félix Medina y Thompson (JOS, 2004). Los estimadores propuestos usan estimaciones máximo verosímiles de las probabilidades de inclusión basadas en modelo. La probabilidad de inclusión de un elemento depende tanto de la probabilidad de inclusión en la muestra inicial de conglomerados de elementos, como de la probabilidad de que el elemento este ligado a algún conglomerado en la muestra inicial. Las probabilidades de ligas podrían ser heterogéneas y depender de los valores de la variable respuesta asociados con los elementos. Los resultados de un estudio de simulación muestran que los estimadores propuestos tienen desempeños aceptables.

18:05 – 18:30

Estimación de parámetros en áreas geográficas pequeñas

Miguel Ángel Suárez Campos, José Vences Rivera, y Raúl Mejía Gonzáles
Dirección de Desarrollo de Procesos Estadísticos/Dirección General de Estadísticas Sociodemográficas, INEGI

Una de las metas a largo plazo del Programa Estratégico del Sistema Nacional de Información Estadística y Geográfica, que coordina el INEGI, es generar información para áreas geográficas pequeñas de manera continua, lo que motiva al conocimiento de nuevas técnicas de estimación para poblaciones finitas.

Las técnicas de estimación en áreas pequeñas, hacen uso de información extramuestral que puede provenir de otras fuentes (con mayor presencia muestral en el área pequeña) como son encuestas, censos, registros administrativos o información geográfica, contenida en variables auxiliares de las que se conoce, en unos casos, el valor para cada elemento de la población y, en otros, solamente el total de cada dominio o área pequeña.

Una fuente confiable pero poco explotada es la información geográfica, donde se intuye que variables sobre clima, uso de suelo, fisiográficas y de medio ambiente pueden estar relacionadas con variables socioeconómicas, generalmente a nivel de área pequeña.

En el ámbito internacional se han realizado muchos esfuerzos para la consolidación de estas técnicas, como ejemplos están el proyecto EURAREA desarrollado por la EUROSTAT, además de múltiples publicaciones realizadas por las oficinas nacionales de estadística de Canadá, Australia, España, Brasil y Colombia, entre otros, con aplicaciones derivadas de encuestas en hogares y en establecimientos. En México fueron aplicados para la obtención del Índice de Desarrollo Humano en 2002 y para el cálculo de la pobreza municipal por el CONEVAL en 2007 y 2010.

La estructura de la ponencia comienza con una explicación gráfica del modelo de área, después se propone una metodología para conseguir modelos congruentes para obtener estimaciones y predicciones con una precisión razonable, y continúa mostrando los resultados de un par de ejercicios con datos del Censo de Población y Vivienda 2000, para estimar el promedio municipal de la variable ingreso por producto del trabajo para cada vivienda, mediante la extracción de una muestra aleatoria con diseño estratificado y referente a nivel estatal, se comparan las estimaciones del modelo de área con la estimación directa y con los resultados censales para los municipios muestreados, para los que municipios sin muestra se comparan las predicciones sólo con las cifras censales.

Una vez asimiladas estas técnicas en diversas situaciones respecto a la variable dependiente y a las características muestrales de las encuestas, el beneficio de su aplicación a las resultados que ofrecerá el INEGI a los usuarios es evidente, ya que se amplía y se mejora la estimación de las cifras que arrojan actualmente las encuestas vía estimación directa, sin incrementar los gastos de campo

18:35 – 19:00

Estimación en áreas pequeñas, caso de pobreza

Ignacio Méndez Ramírez, IIMAS, UNAM
Hortensia Moreno Macias, Economía/ Área de modelación y sistemas, UAM-I

Se plantea una forma de efectuar estimaciones en “áreas pequeñas”. La metodología propuesta se considera útil, cuando se tenga una muestra probabilística planeada para estimar variables de interés en toda una población. Se consideran dominios o subconjuntos que se forman al interior de la población con el uso de conglomerados. El objetivo es estimar promedios de las variables de interés en esos dominios de la población. Lo usual es que al considerar la muestra inicial, los tamaños de muestra que ocurren en los dominios son pequeños o nulos, las “áreas pequeñas”. Además se cuenta con datos censales de variables auxiliares para las áreas pequeñas y para la población. En la propuesta de investigación, como un ejemplo, se utiliza la estimación de dos variables de pobreza en cada uno de los 210 municipios de Veracruz. Los resultados son muy satisfactorios, tener estimadores de promedios con intervalos de confianza al 95%, suficientemente pequeños, para todos los municipios. Este problema se trabajó mediante un contrato con el Consejo Nacional de Evaluación de la Política Social, CONEVAL; y con la participación del Colegio de México, Colmex.

Probabilidad

Probabilidad

Jueves 22 de septiembre
Auditorio (16:00 - 16:55)
16:00 – 16:25

Una nota sobre un converso en teoría de la medida

José María González-Barrios Murguía, IIMAS, UNAM

En este trabajo se analiza un converso natural en la construcción de una gran familia de medidas en el sigma-álgebra de Borel en los reales, conocida como la familia de medidas de Lebesgue-Stieltjes. En particular se estudia el caso de este converso en dimensiones mayores o iguales a dos.

16:30 – 16:55

Un modelo probabilístico para el metro de la ciudad de México

Blanca Rosa Pérez-salvador y Patricia Saavedra Barrera
Depto. de Probabilidad y Estadística, UAM-I

Estudiar al Metro de la ciudad de México utilizando un modelo probabilístico, representa un reto por la complejidad de los elementos que lo conforman. Por un lado, están los trenes que se mueven a lo largo de los rieles, deteniéndose en cada andén para dejar y recoger pasajeros. Por otro lado se tiene a los usuarios que llegan a los andenes para abordar los trenes desde el exterior, o de otras líneas cuando la estación objetivo es de correspondencia. En este trabajo se revisará un modelo probabilístico mediante el cual se describen los movimientos de los trenes y de los usuarios, así como la relación entre estos dos movimientos. Este modelo sirve de base para la elaboración futura de un micro simulador.




Pruebas de Hipótesis

Prueba de Hipótesis

Jueves 22 de septiembre
Aula Magna (11:35 - 14:00)
11:35 – 12:00

Pruebas de bondad de ajuste bajo el esquema de muestras en conjuntos ordenados

Francisco Javier Pérez Arredondo, Departamento de Economía y Finanzas, Universidad de Guanajuato
Adolfo José Quiróz Salazar, Universidad Simón Bolívar (Venezuela)

Se presentan resultados teóricos y empíricos de cuantiles y potencia de cuatro pruebas clásicas de bondad de ajuste en el caso de que las observaciones provengan de muestreo en conjuntos ordenados (ranked set sampling) en poblaciones normales. Se comparan con los resultados de las mismas pruebas bajo muestreo aleatorio simple.

12:05 – 12:30

Nuevas medidas para evaluar la capacidad predictiva en selección genómica

Juan Burgueño y José Crossa
CRIL, CIMMYT Int

En selección genómica se usa información genética de los individuos para predecir el fenotipo de los mismos con lo que se ahorra mucho tiempo y dinero. Una selección efectiva supone una predicción precisa. Existen diferentes metodologías y modelos para obtener la predicción, por lo que es necesario evaluar el poder predictivo de éstas, para lo cual se han utilizado diversas medidas, coeficiente de correlación y error cuadrático medio. Se proponen nuevas medidas para ser utilizadas en el proceso de comparar métodos y modelos de predicción en el contexto de la selección genómica, las cuales son más fáciles de interpretar que las usadas habitualmente, son más sensibles para diferenciar entre modelos y están relacionadas directamente con el objetivo del mejorador que va a hacer uso de las predicciones.

12:35 – 13:00

Pruebas de hipótesis para modelos no lineales no anidados

Roxana Góngora Hernández, Área de Matemáticas, Instituto Politécnico Nacional
Jorge Domínguez Domínguez, CIMAT A.C.

En muchas situaciones de la realidad se está interesado en saber el comportamiento de un fenómeno, por tanto la construcción de modelos estadísticos es utilizo surgiendo en ocasiones varios modelos alternativos, entonces surge el problema de seleccionar el modelo más adecuado del conjunto que se tenga. Un método usado para seleccionar entre los modelos es a través de pruebas de hipótesis. Las pruebas de hipótesis implican generalmente modelos anidados, en la cual el modelo que representa la hipótesis nula es un caso especial de un modelo más general que representa la hipótesis alternativa. Para este modelo, siempre se puede probar la hipótesis nula mediante pruebas de las restricciones que se imponen a la alternativa. Pero a menudo surgen modelos los cuales no están anidados. Esto significa que ninguno de los modelos puede ser escrito como un caso especial del otro sin imposición de restricciones en ambos modelos. En tal caso, no podemos simplemente probar uno de los modelos contra el otro, al imponer restricciones en uno de ellos.

Existe una extensa literatura sobre las pruebas de hipótesis no anidadas. Esta proporciona un gran número de maneras de probar la especificación de los modelos estadísticos cuando una o más alternativas no anidadas existen. En esta presentación se presentará algunas pruebas de hipótesis no anidadas, principalmente en el contexto de los modelos de regresión, para la seleccionar un modelo dentro de un conjunto de modelos alternativos.

Las pruebas estudiadas fueron, la prueba de Davidson y MacKinnon, la prueba de Hoel y los métodos de discriminación presentados en el libro “Model Discrimination for Nonlinear Regresssion Models” de Borowiak Dale S. (1989), además se realizó una revisión de la prueba del criterio de Información de Akaike.

Para ilustrar la aplicación de estas pruebas y formas de discriminación se utilizaron dos conjuntos de datos, un conjunto de datos médicos, en específico datos de mediciones realizados a fetos en desarrollo y un conjunto de datos de bioquímica, donde se midió la producción de Nisina en un cultivo de leche

13:05 – 13:30

Identificabilidad y comparación de métodos de estimación para mezclas Weibull univariadas

Olga Vladimirovna Panteleeva y Humberto Vaquera Huerta
ISEI, Colegio de Postgraduados
Eduardo Gutiérrez González, UPIICSA-IPN

Los modelos de mezclas finitas de distribuciones Weibull son estudiados mostrando sus propiedades generales. Se prueba la identificabilidad del modelo y se comparan las estimaciones de los parámetros para el caso de dos componentes. Los estimadores de los parámetros se buscan por Máxima Verosimilitud calculados bajo diferentes algoritmos: EM, Fisher scoring, backfitting, optimización de los vecinos más cercanos y un último algoritmo de recorridos aleatorios a través de simulación Monte Carlo. Por medio de simulación se calcula y compara el sesgo y el error cuadrado medio de los estimadores por tres métodos.

13:35 – 14:00

Verificación del supuesto de homogeneidad de varianzas bajo censura

Violeta De La Huerta Contreras, y Humberto Vaquera Huerta
ISEI, Colegio de Postgraduados

El ANOVA es muy usado, existen muchas pruebas para verificar homocedasticidad, sin embargo se tiene una limitante en el ámbito práctico cuando la muestra es censurada. El objetivo fue investigar el comportamiento de la prueba de Bartlett bajo censura por la derecha tipo II. Se utiliza el método ML para estimar las varianzas, se investiga el comportamiento asintótico del estadístico y por medio del método Monte Carlo (donde tanto el tamaño y censura de n1 sea = diferente a n2), se obtiene la distribución. Encontramos que contar con esta metodología es útil ya que conforme aumenta la censura en las muestras, la media y varianza de la distribución del estadístico de Bartlett aumenta considerablemente. Las tablas de valores de la distribución fueron generadas así como el tamaño, potencia y robustez de la prueba.

Series de Tiempo

Series de tiempo

Miércoles 21 de septiembre
Auditorio (16:00 - 17:25)
16:00 - 16:25

Aplicaciones de modelos lineales dinámicos

Víctor Aguirre Torres, Depto. de Estadística, ITAM
Gabriel Cervantes, ITESM

Se muestran los conceptos asociados a los Modelos Lineales Dinámicos para series de tiempo, los cuales tienen como punto de partida el enfoque Bayesiano para permitir que los parámetros del modelo evolucionen en el tiempo. Esto hace que sea una herramienta de pronóstico flexible, oportuna y capaz de incorporar fácilmente las previsiones del usuario. Se presentan unos ejemplos y finalmente se hace un análisis comparativo breve con otros enfoques de pronóstico.

16:30 - 16:55

Pronósticos de poblaciones con series de tiempo multivariadas: el caso de la ZMCM contrastado con datos del censo 2010

José Eliud Silva Urrutia, Actuaría, UNAM
Manuel Ordorica, El Colegio de México

Con base a metodologías de series de tiempo multivariadas, se muestra cómo es factible realizar pronósticos de población y se evidencia cómo estos son satisfactorios de acuerdo con datos censales observados para la Zona Metropolitana de la Ciudad de México, tomando en consideración los resultados del Censo de Población y Vivienda 2010. Se enuncia de manera general la metodología empleada para realizar los pronósticos, partiendo de técnicas de desagregación, ajustes y la elaboración de los pronósticos restringidos. También se mencionan Pruebas de compatibilidad estadísticas, como herramienta objetiva en la formulación de planes de crecimiento demográfico. Se considera que tener herramientas metodológicas capaces de proyectar de manera eficiente, resultan indispensables para la elaboración de planes que tengan por objeto, entre otras cosas, sociedades en armonía con el medio ambiente.

17:00 - 17:25

Pronóstico de la demanda de energía eléctrica mediante series de tiempo

José Del Carmen Jiménez Hernández, Felipe De J. Trujillo Romero, y Williams Gómez López
Instituto de Física y Matemáticas, Universidad Tecnológica de la Mixteca

El pronosticar algún fenómeno repercute tanto en la toma de decisiones de una empresa como en la planificación de recursos para una producción mayor y más eficiente, además, el conocer el suceso que va a pasar en el futuro permite tomar ciertas medidas preventivas. El objetivo principal de este trabajo es realizar la predicción para un conjunto de datos, los cuales corresponden a la demanda máxima mensual de energía eléctrica en una subestación de distribución proporcionados por la Comisión Federal de Electricidad. Dicha predicción se realiza mediante la metodología de Box and Jenkins de series de tiempo, además de realizar la comparación de dichas predicciones con las realizadas mediante redes neuronales artificiales usando "backpropagation" como el algoritmo de aprendizaje de la red neuronal.

Teoría y Aplicaciones de Valores Extremos

Teoría y Aplicaciones de Valores Extremos

Miércoles 21 de septiembre
Auditorio (12:05 - 14:00)
12:05 – 12:30

Análisis de máximos para datos espaciales de lluvias

Ehyter Martín y Joaquín Ortega
Depto. de Probabilidad y Estadística, CIMAT A.C.

En este estudio se analizan los datos máximos de lluvias correspondientes al Estado de Guanajuato utilizando la teoría de valores extremos y los modelos espaciales para extremos multivariados propuestos por Smith y Schlather en sus trabajos de 1990 y 2002, respectivamente. El análisis se hizo considerando valores máximos mensuales y ajustando los modelos de Smith y Schlather a los valores máximos correspondientes a cada mes del año, con fines comparativos. En total se tienen 24 modelos ajustados. En esta plática se presentarán algunos de estos modelos, así como las interpretaciones y debilidades correspondientes a cada uno.

12:35 – 13:00

Modelación de valores máximos de ozono

María Guzmán Martínez, Colegio de Postgraduados
José Aurelio Villaseñor Alva, ISEI, Colegio de Postgraduados
Javier Suarez Espinoza, ISEI, Colegio de Postgraduados
Enrique Raúl Villa Diharce, CIMAT A.C.
Elizabeth González Estrada, ISEI, Colegio de Postgraduados

El cambio climático se ha convertido en un tema IMPORTANTE en los últimos años. Algunas Ciudades más desarrolladas, tienen sus propios sistemas de monitoreo para evaluar la calidad del aire. Tal es el caso de la zona metropolitana de Guadalajara, México, que tiene su red de monitoreo atmosférico. En este trabajo se analizaron los máximos diarias del ozono, procedentes de la estación de monitoreo Centro, ubicada en la zona centro de Guadalajara, México. La base de datos que se analizó contiene las observaciones del período 1997 -2008. El objetivo de este trabajo es comparar el ajuste del modelo de probabilidad conjunta propuesto por Villaseñor y González (2010) y el de la distribución Pareto Generalizada (DPG). Con base en pruebas estadísticas realizadas, se obtuvo que los dos modelos propuestos proporcionan un buen ajuste; no obstante el modelo de probabilidad conjunta ofrece un análisis estadístico más completo para este tipo de datos, dado que se considera una variable adicional, la cual es útil para propósitos de predicción.

13:05 – 13:30

Estimación del valor en riesgo en la bolsa mexicana de valores usando modelos de heterocedasticidad condicional y teoría de valores extremos

Alejandro Iván Aguirre Salado, Humberto Vaquera Huerta y Martha Elva Ramírez Guzmán
ISEI, Colegio de Postgraduados
José René Valdez Lazalde, Ciencias Forestales, Colegio de Postgraduados
Carlos Arturo Aguirre Salado, Facultad de Ingeniería, Universidad Autónoma de San Luis Potosí

Se propone una metodología para la estimación del valor en riesgo (VaR) para el índice de precios y cotizaciones de la bolsa mexicana de valores mediante el uso combinado de modelos autoregresivos y de medias móviles (ARMA), modelos autoregresivos generalizados de heterocedasticidad condicional (GARCH)y la teoría de valores extremos. Los modelos ARMA se usaron para obtener residuales no correlacionados, que sirvieron de base para el análisis de valores extremos. Los modelos GARCH, al incluir en el modelo las volatilidades pasadas, son particularmente útiles en periodos de inestabilidad como de calma. De manera paralela se usó el método riskmetrics, a manera de comparación para las metodologías propuestas. Se concluye que el método propuesto presentó un mejor desempeño con respecto al método de riskmetrics, evaluadas al mismo nivel de error y confiabilidad en el ajuste de kupiec.

13:35 – 14:00

Análisis de tendencia en los extremos de variables meteorológicas, en el Estado de Durango

Ma. Esperanza Blanco Ramírez, Colegio de Postgraduados
Humberto Vaquera Huerta, ISEI, Colegio de Postgraduados
Michel Rosengaus, Servicio Meteorológico Nacional
José René Valdez Lazalde, Ciencias Forestales, Colegio de Postgraduados

Se describirá una metodología para analizar tendencias en series de tiempo de variables climáticas extremas (precipitación máxima, temperatura mínima, temperatura máxima), en el estado de Durango. Esto, con el fin de acumular evidencia sobre los efectos del cambio climático en eventos extremos. Se utilizará la distribución de valores extremos generalizada considerando no estacionariedad en las series. Para estimar tendencias nos basamos en un modelo de regresión (Vector Generalized Linear Models), para probar la hipótesis de estacionariedad a partir de la prueba de razón de verosimilitudes generalizada. La base de datos utilizada es la Maya 1.0 proporcionada por Servicio Meteorológico Nacional, y en particular utilizamos los máximos anuales (1961- 2000). Los resultados se presentan en un mapa de tendencias de eventos extremos para el estado de Durango.