Cómo integrar KNIME con R

Recientemente tuvimos una sesión de presentación de KNIME, una plataforma open-source que ha conseguido posicionarse entre las primeras en el cuadrante de Gartner en la categoría de Data Science y Machine Learning.

Introducción

Entre las características que nos animan a probarla encontramos:

  • Capacidad para construir flujos de análisis de datos fácilmente comprensibles, basados en nodos que pueden ser reutilizados posteriormente.
  • Cuenta con una comunidad activa que, con sus aportaciones en campos muy diversos, hace de KNIME una herramienta viva.
  • La posibilidad de instalar extensiones de Python o R, que nos permiten integrar nuestros scripts ya existentes en el flujo de trabajo.

Demos un repaso a la guía rápida de inicio como introducción a KNIME.

Tras instalar la versión correspondiente aterrizamos en la herramienta. El entorno nos puede recordar a otras interfaces, como la de SAS Enterprise Guide. Está basado en la funcionalidad drag and drop, que hace de su uso algo muy intuitivo. Vemos cómo se organiza la zona de trabajo:

Integración con R

Lo que nos ocupa en este post es la integración de R en el entorno de KNIME. Este nos parece uno de los puntos fuertes de la plataforma, ya que nos permite reutilizar nuestros scripts.

Antes que nada exploremos el repositorio de nodos, ya que en muchos casos nos puede ahorrar teclear líneas de código. Cuando la herramienta no cubra necesidades específicas, podremos complementarla con scripts.

  • Descargando extensión de R

Para poder interactuar con R descargaremos su extensión: File > Install KNIME Extensions > exploramos las extensiones disponibles y seleccionamos Sources > Source for KNIME Interactive R Statistics Integration.

  • Introduciendo nodo R Snippet.

A partir de ahora tendremos acceso  a diversas funcionalidades, entre ellas R Snippet, que nos da paso a una consola interna de R que permite ejecutar código.

Si arrastramos el elemento R Snippet desde el Node Repository al editor, con el botón derecho podremos configurarlo (la flecha de flujo que llega a este nodo indica un origen de datos que previamente hemos leído).

  • Tecleando código.

Al abrirse la consola podemos introducir nuestro código a partir de la segunda línea.

Si hacemos click en la Ayuda tendremos acceso a la descripción del nodo correspondiente.

  • Evaluando código.

Si evaluamos el script veremos cómo aparece el resultado del código ejecutado en la consola.

  • Ejecutando R Snippet.

Finalmente, ejecutaremos este nodo.

Vemos que una vez ejecutados correctamente los nodos, aparecen con ‘luz verde’ en nuestro flujo.

  • Visualizando resultados.

Si en lugar de ‘Execute’ seleccionamos ‘Execute and Open Views’, se mostrará el output del código previamente ejecutado, en este caso una tabla cruzada.

Hasta aquí nuestro ejemplo de integración de R con KNIME.

Conclusiones

Nos ha resultado una plataforma muy útil e intuitiva, permitiendo tener una instantánea del proceso completo de análisis, aprovechando tanto los nodos predefinidos como la opción de introducir scripts.

Para ir familiarizándonos podemos acceder a flujos de análisis de ejemplo desde el explorador.

Asimismo, les animamos a revisar la amplia propuesta de soluciones ofrecidas por KNIME en diversos campos, así como consultar su foro, donde encontrar respuesta a cuestiones más concretas.

Enjoy KNIMing!!!

Lourdes Hernández

Lourdes Hernández

Share on facebook
Share on twitter
Share on linkedin
Share on email
2 min
Suscríbete a nuestra newsletter

Los mejores artículos de analítica digital para potenciar tu negocio.

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Entradas relacionadas

Jupyter Notebook

Jupyter Notebook es una aplicación web de código abierto que permite incluir texto, vídeo, audio e imágenes.

4 minutos

Dificultad