Ave, Python, los analistas de datos te saludan

Como usuarios de R, alguna vez hemos hecho llamadas a la librería rPython.

En anteriores posts se ha hecho una introducción a R y llega el turno de Python, un lenguaje de programación en código abierto que, entre otros, dispone de paquetes específicos para almacenar, manipular y analizar datos.

Hoy instalaremos numpy, un paquete que permite el uso de funciones estadísticas y el cálculo matricial.

Hay dos maneras de trabajar:

  • De forma interactiva: tecleamos código e inmediatamente vemos los resultados. Para ello usamos el intérprete IPython:

    https://www.python.org/shell/

0_python shell
  • Ejecutando scripts: son archivos de texto (.py) con comandos Python línea a línea. Permite realizar cambios y volver a ejecutar. En este caso no se muestran los resultados de forma automática, para ello usamos la función print().

Haremos una demo de instalación en Windows, para otros sistemas operativos encontramos la ayuda en cada uno de los links que se citan a continuación.

 

1. Instalando Python.

Podemos descargar la última versión en el siguiente enlace y ejecutar el .exe.

https://www.python.org/downloads/

1_python download
 

2. Instalando pip.

El paso siguiente es instalar el paquete pip, encargado de la instalación de otros paquetes y el mantenimiento del sistema en Python. Lo podemos descargar en:

http://pip.readthedocs.org/en/stable/installing/

2_pip

2.1. Abrir línea de comandos de Windows.

Inicio > Buscar > teclear cmd

3_cmd

2.2. Cambiar al directorio en que tenemos el get-pip.py que acabamos de descargar:

> cd C:\Users\metriplica\Downloads

2.3. Ejecutar:
> get-pip.py

Sale un mensaje ‘Requirement already up-to-date:…’ que pide la actualización si nuestra versión es Python 2 >=2.7.9 or Python 3 >=3.4.

2.4. Buscar en el directorio donde se ha instalado Python el archivo pip.py, que suele colgar de \Scripts\ y arrastrarlo a la línea de comandos.

4_instalar pip

Aparecerá un listado con los comandos y opciones que admite pip.
Con esto ya podemos usar pip para instalar paquetes de Python.

 

3. Instalando numpy.

3.1. Cambiar al directorio \Scripts\ (asegurarnos de que pip.exe se encuentra en esta carpeta y en caso contrario modificar la ruta a la que lo contenga):

> cd C:\Users\metriplica\AppData\Local\Programs\Python\Python35-32\Scripts

3.2. Instalar paquete:

> pip3 install numpy

3.3. Cambiar al directorio en que está instalado Python:
> cd C:\Users\metriplica\AppData\Local\Programs\Python\Python35-32
o

> cd.. (sube un nivel en el path)

3.4. Ejecutar Python. Con esto pasamos de la línea de comandos del sistema al intérprete de Python:
> python
>>>

 

4. Importando numpy.

4.1. Para poder hacer uso de los objetos y funciones de un paquete es preciso importarlo una vez instalado:

>>> import numpy

5_instalar numpy

4.2.En la ayuda encontramos una descripción detallada:

>>> help(numpy)

6_help numpy
 

5. Saliendo del intérprete de Python.

>>> quit()

 

Hasta aquí la instalación del paquete numpy. Disponemos de otros como matplotlib (gráficos) y scikit-learn (machine learning) que le complementan en la apasionante aventura del análisis de datos 

2 Comments

  1. Hola Lourdes,

    La verdad que soy usuario de R. Pero python aún no he empezado en serio.

    Me voy a poner con este software. Voy a usar tu tutorial 😉

    Saludos!

  2. Lourdes Hernández

    Hola Jordi,

    Creo que como usuarios de R a todos nos pica la curiosidad sobre si Python es realmente un competidor a nivel de análisis.

    Espero que te sea de utilidad, saludos y gracias por seguirnos!

Leave Comment

Your email address will not be published. Required fields are marked *