Cómo instalar Anaconda 3 en Windows 11

Consultores estratégicos en Ciencia de Datos

En este documento vamos a explicar paso a paso cómo instalar Anaconda Navigator 3 para Windows 10 o 11  paso a paso

¿ Qué son las Jupyter Notebooks ?

Como primer paso para manejar nuestros conjuntos de datos (data sets)utilizaremos  la herramienta favorita de los científicos de datos el llamado  Jupyter Notebooks.

que funciona como un cuaderno de notas «interactivo» donde podremos ir haciendo paso a paso nuestros ejercicios y nuestros propios proyectos de Aprendizaje Automático  (Machine Learning)  e Inteligencia Artificial.

Júpiter notebook se puede utilizar de 2 formas diferentes:

a.) Desde Google a través de una herramienta llamada Google colaboratory,  la cual permite ejecutar Júpiter notebook en un ambiente totalmente en la nube como sin la necesidad de estar instalando librerías no cambiará nada desde terceras fuentes.    Hay muchos tutoriales de cómo utilizar colaboratory.  Lo primero que hay que hacer es hacer una cuenta de correo en Gmail, con lo que tendremos acceso A Google Drive dónde guardaríamos nuestros modelos de datos.  Activarlo es tan simple como hacer un clic derecho y darle abrir A Google colaboratory, la primera vez que lo utilices se instalará coma y posteriormente no hace falta instalarlo nuevamente. Los archivos de Júpiter notebook tienen la extensión tipo «.ipynb» posteriormente Google reconocerá este tipo de extensión para seguir abriendo la Júpiter notebook de manera automática.

b.) la segunda forma de utilizar Júpiter notebook es a través de una suite de datos muy utilizada también en el mundo de la ciencia de datos y que se conoce como Anaconda  Navigator.   Esta s la Suite más completa para la Ciencia de datos y que utiliza el lenguaje Python, y cuenta con más de 25 millones de usuarios alrededor del mundo.   y que nos brinda una gran cantidad de funcionalidades que permitirán que desarrollemos aplicaciones de una manera más eficiente, rápida y sencilla.  Dentro de anaconda Navigator también se incluye el conocido paquete R muy utilizado en el mundo de la estadística y el procesamiento de datos.

Anaconda navigator la mejor suite para la ciencia de datos

 

Anaconda es una Suite de código abierto que abarca una serie de aplicaciones, librerías y conceptos diseñados para el desarrollo de la Ciencia de datos.   funciona como un gestor de entorno, un gestor de paquetes y que posee una colección de más de 720 paquetes de código abierto.  La instalación de anaconda es relativamente simple y tiene la ventaja de qué es interoperable o sea que puede instalarse ya sea en ambientes Linux,  Windows, iOS (Mac).

La ultima versión de Anaconda es la 3 (Marzo 2022) y por defecto instala la versión de Python 3.9, lo cual es hasta cierto punto un problema, ya que muchas de las librerías que se pueden necesitar para nuestros modelos de datos todavía no han sido actualizadas a esa versión de Python,  por lo tanto utilizaremos una de las grandes funcionalidades que ofrece Anaconda que se conoce como «ambientes virtuales» en los cuales es posible instalar diferentes versiones de Python, y por tanto seguir utilizando las librerías anteriores que si funcionaban  por ejemplo la versión de Python 3.7

 

Anaconda Navigator 3.0 módulos y componentes

Pasos para la instalación

1) Lo primero es ingresar a esta dirección y descargar la versión ó distribución que corresponde a nuestro computador (Windows, Mac , o Linux ). OJO no hay disponibilidad de Anaconda para Smartphones ni tabletas.

https://www.anaconda.com/products/individual

El sistema de forma automática identificará su sistema operativo y le guiará hacia la mejor versión para usted, en caso contrario seleccione la mejor versión de acuerdo a su computador y su sistema operativo.

 

Anaconda navigator la suite para la ciencia de datos

Anaconda navigator la suite para la ciencia de datos

2.) Descargue la versión sugerida haciendo clic sobre el boton «Download»

 

Pantalla para la instalación de anaconda navigator 3

Pantalla de instalación para la versión de anaconda navigator 3

en este caso el sistema ha seleccionado para mí la versión 3 para Windows y procesadores de 64 bits.

Ingresando a Anaconda Navigator MENU PRINCIPAL

3.) continúe aceptando las opciones por defecto que le va mostrando la instalación y que finalmente lo llevará a la pantalla de inicio básica donde estarán instaladas las aplicaciones esenciales.  ( al inicio notará que varias pantallas de color negro se Irán apareciendo y desapareciendo hasta que finalmente llegará al menú principal.  En nuestro caso seleccione la opción Júpiter Notebooks,  (preste atención que también hay otra opción con un nombre similar llamada Júpiter Labs, que es un poco mas completa pero un tanto compleja al inicio)

Menú principal Júpyter notebook

Menú principal Júpyter notebook

seleccione el icono de la primera fila a la derecha. (jupyter Notebook)     el programa tarda unos segundos en arrancvar.  ESPERE !!!

 

4.) Una vez dentro de Jupyter , el primer paso es familiarizarse con los menús, e ir actualizando algunas de las versiones internas.  Para ello deberá localizar en primer término el boton par acceder a la ventana de terminal.

Localice en la parte superior derecha el botón New, haga clic, hasta la opción terminal y se abrirá una pantalla en negro, similar a la siguiente:

Júpiter notebook ventana terminal

Júpiter notebook ventana terminal

5.) paso seguido actualizaremos e instalaremos algunas de las librerías necesarias desde el inicio.  Ahora deberá ir escribiendo estos comandos (ponga especial cuidado en los espacios y en las mayúsculas /minúsculas) si obtiene un error, puede escribirlo de nuevo)    haga un enter después de cada línea para ir ejecutando los comandos uno por uno

 

conda update conda
conda update conda-build

conforme vaya instalando las diferentes librerías podrá ir obteniendo pantallas similares a esta,  observe que debe dar su aprobación (Proceed ( y / n) para la respectiva instalación con la tecla «Y» de yes aprobado .

Júpyter notebook instalando librerías

Júpyter notebook instalando librerías

Instalación de librerías en Jupyter Notebook

A lo largo del curso hablaremos de Cómo instalar Anaconda 3 en Windows 11 paso a paso, par ello les iré compartiendo algunas notebooks que posiblemente requieran alguna librería que no está instalada. En estos casos para instalar esas librerías se puede hacer de diversas maneras:

a.) la manera más simple de instalar una librería es con el comando PIP seguido del nombre de la librería. Veamos estos ejemplos:

Ej. pip install pandas  pip install numpy, pip install selenium, pip install xgboost, etc

b.) tambien se pueden instalar con sus dependencias dentro del ambiente «conda» de Anaconda  (con esta forma de instalación se instalan además algunas otras librerías que son dependientes de la librería principal y que en ocasiones son requeridas para realizar algunas funciones más específicas dentro de los modelos. Si ya tiene alguna experiencia puede utilizar preferiblemente el comando que a continuación se describe

Ej. conda install lightgbm   

b.1) las librerías de condá están en repositorios públicos que se conocen como canales,  muchas veces estos repositorios deben indicarse de manera explícita, lo que facilita su instalación de manera más expedita

Ej. conda install -c conda-forge lightgbm

c. )  otra forma simple de instalar las librerías con sus respectivas dependencias es directamente desde el menú principal de anaconda,  (ver tres pasos en la figura)  . Veamos la pantalla donde se accede a estas opciones

 

Júpiter notebook agregando librerías adicionales

Júpiter notebook agregando librerías adicionales

Instalación de los ambientes virtuales (vitual environments)

Dentro de las instrucciones de Cómo instalar Anaconda 3 en Windows 11 paso a paso,  debemos reconocer que una de las grandes ventajas que ofrece Anaconda es la posibilidad de instalar simultáneamente varios ambientes de trabajo. A estos ambientes se les conoce como ambientes virtuales o virtual environments.

Para crear un ambiente virtual en anaconda debemos entrar al mismo menú que expusimos anteriormente en la opción environments y debemos seleccionar del menú inferior la opción crear.

El menú nos pregunta qué versión de Python queremos instalar y el nombre que queremos darle al nuevo ambiente de trabajo.

Podemos utilizar cualquier nombre por ejemplo Python37  y escogemos la versión de Python 3.7. x para arrancar.  Una vez que el proceso finaliza entramos utilizando el mismo menú a la opción de ventana terminal del nuevo ambiente de trabajo que recién acabamos de crear.

Júpyter notebook agregar ambiente de trabajo virtuales

Júpyter notebook añadiendo ambientes de trabajo virtuales

Instalar librerías dentro de ambientes virtuales

Si queremos instalar  librerías, siempre debe ser en algún ambiente determinado .  Para hacerlo  primero debemos seleccionarlo y abrir la ventana terminal respectiva.  ( la ventana terminal mostrará a la izquierda el nombre del ambiente de trabajo escogido)

Júpyter notebook ambiente virtual ventana terminal

Júpyter notebook ambiente virtual- ventana terminal-

una vez abierta la ventana terminal podemos utilizar las opciones de instalación antes mencionadas coma ya sea, PIP, conda, ó a través de anaconda los ambientes de trabajo deben activarse ya sea de forma manual o a través de anaconda.

Los comandos para instalar y activar los ambientes virtuales son los siguientes:  ( estos comando se escriben  en la ventana terminal del ambiente «Base ó root»

CREAR:  conda create -n v-env python=3.7   ( OJO: v-env es un nombre cualquiera escogido por mi )
ACTIVAR:  conda activate v-env

Para consultar comandos adicionales que se utilizan en los ambientes virtuales y el uso de los kernels consulte acá

Para ver todos los entornos que tenemos instalados se puede utilizar: conda env list

Para instalar paquetes dentro de nuestro entorno virtual podemos hacerlo mediante pip o con el instalador de anaconda.

Para ver todos los paqutes instalados podemos hacerlo con : pip list 

Instalación de otras librerías especializadas

En muchas ocasiones requerimos de la instalación de una serie de librerías es parte de Cómo instalar Anaconda 3 en Windows 1, 1 que no se instalan tan fácilmente cómo dar PIP o conda.  A continuación les doy algunos enlaces de utilidad como por ejemplo para instalar la librería geopandas para análisis geoespacial  ( utilizando mapas ) , o bien la instalación de: xgboost o lightgbm los cuales son  dos de los algoritmos más utilizados en Machine learning en el área de la salud

Geopandas

El paquete GeoPandas ofrece una forma increíble de manipular la información geográfica. Extiende los tipos de datos utilizados por pandas para permitir operaciones espaciales en tipos geométricos.

Ejemplos de operaciones espaciales son la superposición de mapas (combinar dos mapas juntos), el almacenamiento en búfer simple pero, más popularmente, GeoPandas se puede usar para hacer Geo visualización.

Instalación

Si bien GeoPandas es un paquete poderoso para la manipulación espacial, la instalación es un poco desafiante para algunos. Requiere de algunas habilidades avanzadas que si se hacen despacio y en orden no presentarán ningún problema

las librerías se instalarán utilizando los archivos binarios conocidos como archivos wheel  o whl  ( que usualmente se instalan con la ayuda de pip install *.whl on cmd).

  1. Ingrese a la pagina Unofficial Windows Binaries for Python Extension Packages.  ( esta es una página repositorio dónde hubo una Universidad ha decidido llevar adelante un proyecto para almacenar librerías binarias de muchísima utilidad para el ambiente Júpiter con Python
  2.  Busque y descargue en alguno de sus directorios de su computadora las siguientes 5 archivos o librerías :  GDAL, Pyproj, Fiona, Shapely and Geopandas, encontrará en el repositorio una importante cantidad de archivos para cada 1 de estas librerías sin embargo estos archivos varían con respecto a la versión y con respecto a la versión de Python para lo cual fueron creadas,  por tanto  verifique que las mismas coincidan con la versión que tiene instalada de Python y el tipo de procesador instalado ya sea de 32 o de 64 bits.
(por ejemplo  si quisiéramos instalar la librería gdal para Python 37 con (64-bit), el paquete a instalar debería ser: GDAL‑3.1.2‑cp37‑cp37m‑win_amd64.whl.)

una vez descargados las 5 librerías específicas para nuestro computador sigamos adelante con el proceso de instalación de las mismas

  1. Después navegue hasta el directorio donde los programas fueron descargados.

4. Importante: el siguiente orden de instalación utilizando PIP install es absolutamente necesario: (OJO: Escriba “pip install” seguido de un espacio y digite las primeras dos letras del archivo binario luego presione la tecla Tab y el nombre completo aparecerá pip install .\GDAL-3.1.1-cp37-cp37m-win_amd64.whl

  • pip install .\pyproj-2.6.1.post1-cp37-cp37m-win_amd64.whl
  • pip install .\Fiona-1.8.13-cp37-cp37m-win_amd64.whl
  • pip install .\Shapely-1.7.0-cp37-cp37m-win_amd64.whl
  • pip install .\geopandas-0.8.0-py3-none-any
  1. Y esto es todo a partir de ahora ya puedo utilizar debidamente su programa go pandas con todas las librerías requeridas para la elaboración de mapas y análisis espaciales con Jupyter notebook.

Instalación de XGBOOST y de Light GBM.

Si es un miembro activo de la comunidad de Machine Learning, debe conocer las llamadas Boosting Machines y sus capacidades. El desarrollo de Boosting Machines comenzó desde AdaBoost hasta el XGBOOST favorito de hoy. XGBOOST se ha convertido en un algoritmo de facto para ganar concursos en Analytics Vidhya y Kaggle, simplemente porque es extremadamente poderoso.

Sin embargo cuando tenemos una inmensa cantidad de datos  XGBOOST tarda mucho en entrenarse.

Que debemos escoger Ligt GBM o XGboost ?

Es posible que muchos de ustedes no estén familiarizados con Light Gradient Boost,(light GBM )  pero lo estarán después de leer este artículo. La pregunta más natural que le vendrá a la mente es: ¿Por qué otro algoritmo de máquina impulsora? ¿Es superior a XGBOOST?

Estos algoritmos son de los llamados algoritmos de ensamble, ó  métodos de conjunto.  Para obtener más información sobre el aprendizaje conjunto y otras técnicas similares de manera integral, puede leer nuestro artculo previo en este enlace 

Si quiere tener las instrucciones de como instalar estas librerias haga clic acá.

Instalación del ambiente Graphviz

Errores:  archivo ejecutable graphviz EXE  no se encuentra.  GraphViz’s executables not found – Pydotplus graphviz error.

Para desplegar los resultados de la mayoría de los algoritmos de clasificación es necesaria la instalación de una librería especializada conocida como Graphviz. Graphviz lo que hace es convertir imágenes con vectores a una imagen gráfica que es más fácilmente interpretable.   Imágenes similares como las que se presentan a continuación

Algoritmo clasificatorio juanbarrios.com

Algoritmo clasificatorio que requiere de una imagen para visualizarse.Juanbarrios.com

Sin embargo graphviz presenta siempre una serie de retos en su instalación debido a que hay que modificar las variables del entorno de nuestro computador (PATH) para qué Python  pueda realizar dicha conversión.    Veamos pues las instrucciones.

En algunos computadores y en ciertos sistemas operativos con solamente digitar el comando :

pip install graphviz

con solo estos comandos sería suficiente para que todo quede funcionando. Sin embargo,  si después de hacer esto sigue teniendo errores como graphviz excecutabl not found o pydot grahviz error, debe seguir los siguientes pasos.

1.) Instale graphviz para  windows desde este enlace

2.) Modifique las variables de entorno de Windows para que Python pueda encontrar donde se encuentra instalado este programa.

Instalación de configuración variable de entorno

Después de instalar graphviz  es necesario configurar las llamadas variable del entorno, en este caso la variable PATH .  Agregue a la lineas existentes de su «entorno PATH» (vaya a la opción de configuración de Windows y digite editar variables del entorno ) Ingrese  a esa ventana y en la opcion editar,  agregue una nueva línea  donde se indique en qué directorio quedó instalado este nuevo programa Graphviz .     Ver el siguiente ejemplo donde se indica la ruta completa donde se encuentra instalado graphviz.  Reinicie el sistema para observar los cambios.

El presente artículo: Cómo instalar Anaconda 3 en Windows 11 ,  fue escrito por el Dr. Juan I. Barrios Arce, quien es médico especialista en informática médica , Master en Business Intelligence  y consultoria tecnológica.   Es experto en BIG DATA y Ciencia de Datos y aplica en sus investigaciones algoritmos de  inteligencia artificial .  Actualmente es profesor visitante de la cátedra de informática médica en la Universidad de Barcelona

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

HTML Snippets Powered By : XYZScripts.com