martes, 10 de diciembre de 2013

Preparando las V Jornadas de Usuarios de R

Esta semana se celebran las V Jornadas de Usuarios de R organizadas por la Comunidad R-Hispano, asociación de usuarios de R que echó a andar oficialmente en noviembre de 2011, precisamente en el transcurso de las III Jornadas. Es una ocasión única para conocer qué se está haciendo en el mundo de R en España, y compartir un par de días con entusiastas de R.

En esta edición presentaré en conferencia plenaria el trabajo Mejora de la calidad con R: Aplicación de Seis Sigma y otros métodos estadísticos, donde muestro la relación entre Estadística y Calidad basada en tres pilares:
  • Metodologías para la calidad y técnicas estadísticas relacionadas
  • Herramientas disponibles en el software estadístico y lenguaje de programación R
  • Las normas internacionales ISO y su proceso de elaboración
Del resto del programa hay muchas cosas interesantes. Da gusto ver en las conferencias plenarias a amigos con los que estoy trabajando de una forma u otra. También tiene buena pinta la ponencia invitada Optimización Entera Mixta No Lineal (MINLP) con R y Pyomo: Un ejemplo práctico (Jorge Ayuso Rejas). Tengo pendiente implementar Pyomo en mi nuevo paquete optimr, todavía en pañales pero que ya estamos aplicando en el proyecto EnRiMa.

lunes, 23 de septiembre de 2013

Reconocer sintaxis GAMS en gedit (editor de textos Ubuntu)

Esto es lo que he hecho para que al abrir ficheros GAMS en mi editor de textos de Ubuntu me reconozca la sintaxis. La información principal la he tomado de aquí. Hay que crear un fichero gams.lang en una carpeta determinada. Para mi actual instalación de Ubuntu 13.04* es:

cd /usr/share/gtksourceview-3.0/language-specs
sudo touch gams.lang

Edito el fichero con gksudo gedit gams.lang, y le pego el código obtenido en el enlace anterior (el último de los posteados, no sé si hay algo por ahí más actualizado). Ahora puedo seleccionar la sintaxis GAMS en el editor de textos gedit. También lo hago para los .lst, útil para cazar fallos. La sintaxis se selecciona automáticamente, para añadir la extensión .lst simplemente se añade a la propiedad "globs" en el fichero xml, separando con punto y coma.



* Me funciona también para Ubuntu 13.10 y 15.04

Cómo utilizo mis bibliografias bibtex en Microsoft Word

Habitualmente trabajo con LaTeX en Linux en mi trabajo como investigador. En ocasiones tengo que utilizar otros formatos como Microsoft Word como requisito para ciertas publicaciones o informes. Me ha pasado recientemente y encontré la forma de utilizar la bibliografía que estoy utilizando en bibtex para mi tesis en un informe sobre mi participación en el programa YSSP de IIASA.
Para hacer la conversión tuve que instalar la librería bibutils, disponible en los repositorios de ubuntu:

sudo apt-get install bibutils

Una vez instalado, hay que convertir el fichero .bib en .xml que pueda ser importado en Word. Hay que hacerlo en dos pasos, ya que Word usa un formato no estándar de bibliografía en xml:

bib2xml BibTeX_file.bib > output_file.xml
xml2wordbib xml_file.xml > output_file.word.xml

Para usar el fichero output_file.word.xml vamos a Referencias/administrar fuentes y en el cuadro de dialogo seleccionamos el fichero con el botón Examinar. Una vez hecho esto en el cuadro de la izquierda nos aparecen nuestras referencias y podemos añadirlas a la bibliografía del documento en la parte derecha.


A ver si un día encuentro la forma de hacer algo parecido con las ecuaciones, que es lo que más me transtorna a la hora de usar Word.


sábado, 15 de junio de 2013

Importar datos de Excel en una línea

Para muchos usuarios de R, sobre todo en las primeras etapas de aprendizaje del entorno, una de las partes más duras es el manejo de los datos.

Muchos usuarios, por no decir todos, hemos utilizado Excel habitualmente para introducir los datos de nuestra investigación o estudio. A menudo es la forma más cómoda y fácil de introducir datos, y hacer los primeros cálculos, además de ser un entorno que casi todo el mundo conoce. Los usuarios acostumbrados a interfaces gráficas, a menudo descartan utilizar R por las dificultades que se encuentran en los primeros pasos de sus análisis (la creación de los conjuntos de datos).

La forma recomendada para importar datos de Excel a R, es guardar estos datos en un fichero CSV, y posteriormente importarlos desde R con el comando read.csv o read.csv2. Este procedimiento es válido para cualquier otro formato en el que tengamos los datos (SAS, SPSS, MINITAB, ...)

Par la importación directa de ficheros Excel en R, existen varias alternativas. El paquete RODBC permite hacerlo en Windows y Mac. El paquete gdata tiene una función específica (read.xls) pero es necesario tener instalado python. Esto implica que estas soluciones pueden funcionar en unos ordenadores pero no en otros.

Una alternativa es utilizar el paquete XLConnect. Está concebido para manipular ficheros excel desde R, con multitud de opciones. Pero también es posible utilizarlo para leer los datos de un fichero y guardarlos en un dataframe para utilizarlos en un solo paso en R. El comando:

data2<-readWorksheetFromFile("example1.xlsx",sheet=1)

Crea el dataset data2 con los datos de la primera hoja de cálculo del fichero example1.xlsx, en un solo paso y sin más complicación que tener el fichero excel en el directorio de trabajo (o escribir la ruta completa del mismo).

El único requisito es tener Java instalado, que está presente en todos los entornos. El paquete ha sido desarrollado por Mirai Solutions, y está disponible en CRAN.