La API de Facebook y cómo hacer con R la extracción y minería de los datos, todo ello atacando directamente a la API. Para lograr lo anterior, la comunidad de programadores de R ha desarrollado un package muy eficiente.

¿Qué es Graph API explorer?

Se trata de la aplicación principal que pone Facebook a disposición del usuario para introducir y extraer datos de la plataforma. La API Graph se basa en HTTP, por lo que es compatible con cualquier lenguaje de programación que tenga una biblioteca HTTP, como la librería Curl de R.

Mediante grafos podemos cuantificar el grado de conexión (e incluso actividad social) entre todos los usuarios de Facebook, de ahí que se bautice a la app como Graph API.

Para acceder a la herramienta, nos damos de alta en la página de Desarrolladores de Facebook y seleccionamos Herramientas.

Graph API

Interfaz de Graph API Explorer

 

Hacemos clic en Obtener identificador de acceso y a continuación seleccionamos los campos que solicitaremos. Estos se distribuyen a nivel de usuario, eventos, grupos o páginas.

 

Facebook

 

Evidentemente, sólo tendremos acceso a los datos públicos de los distintos perfiles. Para acceder a datos privados, el procedimiento es muy simple:

  1. El usuario en cuestión tendría que crear un nuevo proyecto.
  2. Configurar los permisos y agregar al analista ninja.
  3. Explotación de datos.

Desde la propia herramienta podemos realizar consultas simples como la siguiente. Para más información sobre la sintaxis de la API Graph, consulta el siguiente enlace.

Graph api

Consulta a la página de Metriplica: Categoría de la empresa y posts publicados.

 

Si además estás interesado, entre otras cosas, en conocer las franjas horarias en las que el alcance de tus publicaciones es mayor, o para predecir el valor que te van a generar ciertas campañas sociales, seguramente necesites una herramienta lo suficientemente potente que te ayude a generar más valor en los datos. Y para hacer el Social Mining nuestro candidato número 1 es R Statistics.

¿Cómo hacer el token entre R y la API de Facebook?

Mediante las siguientes líneas de código (no olvidar instalar los paquetes previamente con el comando install.packages(“nombre paquete”) ) accedemos a los datos de la herramienta API Graph, utilizando el identificador de acceso que ofrece la herramienta:

library(httpuv)

library(httr)

library(rjson)

library(RCurl)

library(Rfacebook)

access_token = "<Identicador_acceso_APIGraph>"

options(RCurlOptions=list(verbose=FALSE, capath = system.file("CurlSSL", "cacert.pem",package="RCurl"),ssl.verifypeer=FALSE))

¿Necesitas información sobre algún perfil público o fanpage?

metri_info = getUsers("metriplica",token=access_token,private_info = TRUE)

metriplica_info$name

metriplica_info$category

metriplica_info$likes

 

¿Estadísticas básicas a nivel de post?

getPage("metriplica", access_token, n = 100)

Consulta desde R a la API de Facebook

 

¿Influye la hora de publicación del post en la generación de likes?

Un posible punto de partida, sería agregar los likes generados por cada post por cada hora de publicación.

¿Influye la hora de publicación de los posts en la captación de Likes? la respuesta es claramente, SI

 

¡Así de simple! Únicamente adaptando este código y vuestras claves de acceso a la herramienta, ya podréis ir jugando con los datos.

De cara a próximos posts, os explicaremos cómo hacer el token con el resto de redes sociales. ¡Esperemos que os sea útil!

Facebook y R Statistics para el Social Mining

2 Comments

  1. Muchas gracias Mario por compartir tus conocimientos.

    Con Facebook y R, juntos puedes hacer maravillas 🙂

  2. Mario Martínez

    Gracias a ti Jordi por leernos.
    Pronto publicaremos para el resto de redes sociales, te animo a que nos sigas 🙂

Leave Comment

Your email address will not be published. Required fields are marked *