Emilio López Cano, Estadístico
Bitácora personal de Emilio López Cano, Estadístico (Data Scientist dicen ahora). Enseñando Estadística y Matemáticas en la Universidad de Castilla-La Mancha, y Data Science en la Universidad Rey Juan Carlos. Investigando en proyectos de la Universidad Rey Juan Carlos. Contribuyendo a estándares en AENOR. Formando en la Asociación Estadística de la Calidad. Escribo sobre estos temas.
jueves, 1 de diciembre de 2016
jueves, 24 de marzo de 2016
SixSigma R package new release (0.9-3)
I have just released a new version (0.9-3) of the SixSigma R package, with functions and data used in the books Six Sigma with R and Quality Control with R. The main changes in this new version are related to function ss.rr, for measurement systems analysis (Chapter 5 of Six Sigma with R). After the feedback received by the user Garry Kitchin (thank you very much Garry), I have included the alphaLim argument which allows to set a threshold to do the Gage R&R analysis without the appraisal/part interaction effect (default to 0.05). This is common practice when doing MSA and it was certainly needed an automatic handling of this, similarly to other well-known software packages. In addition, the default value for the sigma argument is now 6 instead of 5.15, in line with the Six Sigma approach.
Another important change is concerned with the F test in the ANOVA table of the full model, i.e., with interaction. The standard ANOVA table returned by R is for fixed effects, but an R&R study implies repeated measures, and therefore the error term (denominator of the F Statistic) should be the interaction one. Thus, the output of the ANOVA table has also changed to return the appropriate tests for the main effects (appraisal, part). What surprised me while checking the references, mainly the AIAG MSA Manual, which is one of the main sources for Six Sigma practitioners, is that in the example provided in page 127 repeatibility MS is used as error term, whilst in the appendix it is used the interaction MS (which is actually common practice in the rest of the references and commercial software).
By the way, I reviewed all the function code, included clearer comments, indentation, spaces, etc. Also a bug in the control limits of the range control chart has been corrected, along with some minor improvements.
I feel really encouraged to continue developing the package when receiving great feedback from people "working in industry where the grip of heavily commercialised software dominates, and feeling like lone warriors battling against this" ;-)
SixSigma package on github
SixSigma package on CRAN
Updates on sixsigmawithr.com
NOTE: It may take some days having the latest version on CRAN. If you read this before that happens, you can get the latest version from github running:
Another important change is concerned with the F test in the ANOVA table of the full model, i.e., with interaction. The standard ANOVA table returned by R is for fixed effects, but an R&R study implies repeated measures, and therefore the error term (denominator of the F Statistic) should be the interaction one. Thus, the output of the ANOVA table has also changed to return the appropriate tests for the main effects (appraisal, part). What surprised me while checking the references, mainly the AIAG MSA Manual, which is one of the main sources for Six Sigma practitioners, is that in the example provided in page 127 repeatibility MS is used as error term, whilst in the appendix it is used the interaction MS (which is actually common practice in the rest of the references and commercial software).
By the way, I reviewed all the function code, included clearer comments, indentation, spaces, etc. Also a bug in the control limits of the range control chart has been corrected, along with some minor improvements.
I feel really encouraged to continue developing the package when receiving great feedback from people "working in industry where the grip of heavily commercialised software dominates, and feeling like lone warriors battling against this" ;-)
SixSigma package on github
SixSigma package on CRAN
Updates on sixsigmawithr.com
NOTE: It may take some days having the latest version on CRAN. If you read this before that happens, you can get the latest version from github running:
library(devtools)
install_github(repo = "emilopezcano/SixSigma", ref = "develop")
lunes, 21 de marzo de 2016
Sobre la importancia de la Estadística para la ciencia
Artículo aparecido en elconfidencial.com: Los investigadores no saben estadística (y eso perjudica a la ciencia)
Recomiendo encarecidamente la lectura de este artículo (y al que le queden ganas de alguno de los artículos científicos a los que hace referencia). Muchos de los científicos que conozco son conscientes de la importancia de la estadística, es algo que realmente les preocupa. Pero cuando llega la hora de la verdad (por el motivo que sea: falta de medios, de ganas, de apoyo, ...) la realidad es que en la mayoría de los casos se aplican "recetas" más o menos conocidas que no duelan mucho. Food for thought.
(imagen enlazada de la noticia, Corbis)
Recomiendo encarecidamente la lectura de este artículo (y al que le queden ganas de alguno de los artículos científicos a los que hace referencia). Muchos de los científicos que conozco son conscientes de la importancia de la estadística, es algo que realmente les preocupa. Pero cuando llega la hora de la verdad (por el motivo que sea: falta de medios, de ganas, de apoyo, ...) la realidad es que en la mayoría de los casos se aplican "recetas" más o menos conocidas que no duelan mucho. Food for thought.
(imagen enlazada de la noticia, Corbis)
domingo, 11 de enero de 2015
Sociedad de Estadística e Investigación Operativa: inscripción gratuita para estudiantes
La Asamblea General de la Sociedad de Estadística e Investigación Operativa (SEIO) decidió el pasado 20 de Octubre que los estudiantes de máster o último año de grado pueden inscribirse en la Sociedad de forma gratuita. La inscripción da derecho a recibir la revista electrónica BEIO y el boletín INFOSEIO via mail, además de todas las comunicaciones que la SEIO realiza a sus socios. Todos los detalles para inscribirse bajo la figura de Socio Estudiante pueden consultarse en la web de la SEIO.
Como socio me parece una iniciativa extraordinaria para que las nuevas generaciones de estadísticos se vayan incorporando a esta formidable profesión.
sábado, 12 de abril de 2014
La Comunidad R Hispano se mueve
La Comunidad R Hispano se mueve
Durante las V Jornadas de usuarios de R celebradas en Zaragoza en diciembre de 2013, tuvo lugar la asamblea de la Asociación Comunidad R Hispano, cuyo objetivo es, según sus estatutos, fomentar el avance del conocimiento y uso del lenguaje de programación R y el desarrollo de la profesión en todas sus vertientes, especialmente la investigadora, docente y empresarial. En dicha junta se propuso la renovación de algunos cargos de la junta directiva, teniendo el honor de ser uno de los vocales entrantes propuestos.La asociación echó a andar durante las III Jornadas celebradas en la Escuela de Organización Industrial (EOI) en Madrid en noviembre de 2011. En realidad un grupo de valientes ya llevaba mucho tiempo organizando cosas y trabajando por la difusión de R en España, una labor impagable. Con su empuje nos unimos unos cuantos más constituyendo la asociación como entidad de pleno derecho, ya que la informalidad previa restringía el margen de maniobra para seguir organizando cosas.
Dos Jornadas después y con la junta renovada, son muchas las cosas que todavía podemos hacer. Además de las VI Jornadas, que ya se están preparando y de las que daremos cuenta muy pronto, la web de la asociación es un punto de encuentro para la comunidad. En ella se puede encontrar información relacionada con R como entradas de blogueRos, cuRsos, ofeRtas de tRabajo, y sobre todo la actividad de los Grupos de Interés Local (GIL) y los Grupos de Interés Temático (GIT). Somos conscientes de que hay mucho por hacer, y una de esas cosas es dinamizar la web de la asociación y fomentar la participación. Estamos trabajando en ello y cualquier sugerencia de la Comunidad será bienvenida.
Una de las cosas que nos faltaba era presencia en las redes sociales. Bueno, como asociación, porque la verdad es que ¡la mayoría de los que fundamos la asociación nos conocíamos por Twitter! y la gran mayoría de nuestros tuits eran y son sobre R. Ahora tenemos una cuenta oficial de la asociación que todo usuario de R debería seguir: @R_Hisp. La gestionamos entre varias personas que esperamos dar una difusión no sólo de la asociación, sino de R en general en el mundo de habla hispana. Además de seguir la cuenta, si te interesa R puedes colaborar en la difusión haciendo mención a @R_Hisp en los tuits que estén relacionados con R, y nosostros lo retuitearemos a toda la Comunidad. Es el primer paso para difundir R y la actividad de la asociación y atraer a nuevos socios, ya que existe un gran desconocimiento de la asociación y queremos cambiar esta situación. Por eso desde aquí animo a todo el mundo a inscribirse como socio. Se me olvidaba: es gratis, como R. Y colaborativo, como R.
lunes, 13 de enero de 2014
La nueva ISO 9001, en septiembre de 2015
De las cuatro líneas principales que se señalan en el artículo, además del mayor énfasis en el enfoque a procesos que siempre es bueno desde el punto de vista del control estadístico, me gusta especialmente la introducción de conceptos sobre "riesgos y oportunidades". Se define el riesgo como efecto negativo o positivo de una situación de incertidumbre, y a través de su consideración se refuerza el carácter preventivo de la ISO 9001. Sin duda esta consideración de incertidumbre y riesgo requerirá la aplicación de técnicas estadísticas, con lo que llevaremos un poquito más de ciencia a la gestión.
martes, 10 de diciembre de 2013
Preparando las V Jornadas de Usuarios de R
Esta semana se celebran las V Jornadas de Usuarios de R organizadas por la Comunidad R-Hispano, asociación de usuarios de R que echó a andar oficialmente en noviembre de 2011, precisamente en el transcurso de las III Jornadas. Es una ocasión única para conocer qué se está haciendo en el mundo de R en España, y compartir un par de días con entusiastas de R.
En esta edición presentaré en conferencia plenaria el trabajo Mejora de la calidad con R: Aplicación de Seis Sigma y otros métodos estadísticos, donde muestro la relación entre Estadística y Calidad basada en tres pilares:
En esta edición presentaré en conferencia plenaria el trabajo Mejora de la calidad con R: Aplicación de Seis Sigma y otros métodos estadísticos, donde muestro la relación entre Estadística y Calidad basada en tres pilares:
- Metodologías para la calidad y técnicas estadísticas relacionadas
- Herramientas disponibles en el software estadístico y lenguaje de programación R
- Las normas internacionales ISO y su proceso de elaboración
Del resto del programa hay muchas cosas interesantes. Da gusto ver en las conferencias plenarias a amigos con los que estoy trabajando de una forma u otra. También tiene buena pinta la ponencia invitada Optimización Entera Mixta No Lineal (MINLP) con R y Pyomo: Un ejemplo práctico (Jorge Ayuso Rejas). Tengo pendiente implementar Pyomo en mi nuevo paquete optimr, todavía en pañales pero que ya estamos aplicando en el proyecto EnRiMa.
Suscribirse a:
Entradas (Atom)