¿ Qué es un modelo de aprendizaje automático o de Machine Learning ?

Consultores estratégicos en Ciencia de Datos

Modelos de Machine Learning o aprendizaje automático

A lo largo de mi formación y en la experiencia adquirida durante los últimos años,  he querido hacer una recopilación de un conjunto de modelos que de alguna forma han servido para en capacitar a mis estudiantes,  en los cursos tanto a nivel internacional, como en mi condición de profesor visitante de la Universidad de Barcelona desde el año 2015.  Por ello con este articulo queremos llegar a responder  la pregunta:  ¿ Qué es un modelo de aprendizaje automático o de Machine Learning ?

A lo largo de este documento, podrán acceder a los diferentes modelos para los cuales adjunto no solamente los conjuntos de datos,  sino que también los accesos a los modelos interactivos,  para que las personas pueda ver el funcionamiento de los mismos en un ambiente,  del que llamamos ambiente de producción.

Habría que comenzar diciendo, que un modelo de aprendizaje automático es una expresión de un algoritmo que analiza montañas de datos, para encontrar patrones o hacer predicciones. Impulsados ​​por datos, los modelos de aprendizaje automático (ML) son los motores matemáticos de la inteligencia artificial.

Las redes neuronales, cada vez más populares (CNN y RNN)

Por ejemplo, un modelo de Machine Learning para la visión por computadora,  podría identificar automóviles y peatones en un video en tiempo real. Uno para el procesamiento del lenguaje natural,  podría traducir palabras y oraciones.

En realidad un  modelo de aprendizaje automático,  es una representación matemática de los objetos y sus relaciones entre sí. Los objetos pueden ser cualquier cosa, desde «me gusta» en una publicación de redes sociales,  hasta moléculas en un experimento de laboratorio.

Modelos de Machine Learning para cada propósito

Sin restricciones sobre los objetos,  que pueden convertirse en funciones en un modelo de ML, no hay límite para los usos de la IA. Las combinaciones son infinitas, pero   ¿ Qué es un modelo de aprendizaje automático o de Machine Learning ?

Los científicos de datos,  han creado familias completas de modelos de aprendizaje automático para diferentes usos, y hay más en proceso.

Aprendizaje automático clásico

Algoritmos básicos de aprendizaje automático

En  el siguiente páginas,  puede ver la taxonomía que he decidido adoptar en mis lecciones y en mi actividad profesional., las cual coincide en términos generales con las otras clasificaciones actuales,  pero que en mi caso le he dado un enfoque más de orden académico.

Por ejemplo, los modelos lineales usan álgebra,  para predecir relaciones entre variables en proyecciones financieras. Los modelos gráficos expresan como diagramas una probabilidad, como si un consumidor elegirá comprar un producto. Tomando prestada la metáfora de las ramas, algunos modelos de ML,  toman la forma de árboles de decisión o grupos de ellos,  llamados bosques aleatorios.

Un modelo de aprendizaje automático para todos

¿Qué es un modelo de aprendizaje automático o de Machine Learning?  Cuando hablamos de modelos,  no solamente nos referimos a los modelos tradicionales de clasificación y regresión,  sino que nos enfocamos en un nuevo paradigma basado en las redes neuronales.

Recientemente,  las redes neuronales han evolucionado a lo que se conoce como el Deep learning o aprendizaje profundo,  el cual es un nivel más avanzado del perceptrón multicapa,  que originalmente dio origen a las redes neuronales.

El aprendizaje profundo (deep Learning) ,  tomó su nombre de la estructura de sus modelos de aprendizaje automático.

Apilan capa tras capa de características y sus relaciones, formando al estilo de un sistema multicapas,

Gracias a su asombrosa precisión en la búsqueda de patrones, dos tipos de modelos de aprendizaje profundo, descritos en el enlace adjunto, empiezan a utilizarse cadadia mas.

Dentro del mundo de la visión por computador,  se utilizan las redes neuronales convolucionales ( CNN ), las que actúan como:  ojos en vehículos autónomos y pueden ayudar a detectar enfermedades, en proyectos de imágenes médicas.  (ver enlaces ,mas abajo)

Por su parte están las redes neuronales recurrentes y los transformadoras ( RNN ), ajustados para analizar el lenguaje hablado y escrito, incluidas en los motores de Alexa de Amazon, el Asistente de Google y Siri de Apple.

Diagrama que muestra cómo ve una red neuronal profunda.
Las redes neuronales de aprendizaje profundo obtuvieron su nombre de su estructura de varias capas.

Elija un modelo previamente entrenado

Elegir la familia de modelos adecuada, como una CNN ( redes neuronales convolucionales) , o la  RNN ( redes neuronales recurrentes ) o un transformador, es un gran comienzo. Pero eso es solo el comienzo.

En el aprendizaje automático, los modelos se entrenan previamente, con el propósito de que adquieran los patrones que vienen intrínsecos en los conjuntos de datos . Se ajusta a grandes conjuntos de datos de entrenamiento,  que son similares a los datos de su caso de uso. Las relaciones de datos, denominadas ponderaciones y sesgos, se optimizan para la aplicación prevista.

Se necesita un enorme conjunto de datos, mucha experiencia en inteligencia artificial,  y una gran capacidad informática para entrenar un modelo. Las grandes empresas compran modelos preentrenados,  para ahorrar tiempo y dinero.

Modelos de Machine Learning

elaborados a lo largo de varios años.

Con ayuda de otros profesores, de materiales escritos coma de cursos en línea, y de mi propia experiencia profesional,  presento  a continuación algunos modelos que han servido para las actividades de formación de los estudiantes que he tenido a cargo,  en los cursos de Big Data e inteligencia artificial en los últimos años y que han ayudado a responder a los estudiantes la pregunta:  ¿ Qué es un modelo de aprendizaje automático o de Machine Learning ?

Veamos algunos ejemplos:

1.) Modelo para la selección de drogas  antihipertensivas

Este es un modelo supervisado,  (de los que requieren entrenamiento) el cual está compuesto por un total de 50000 casos,  con un conjunto de 14 variables,  los cuales de alguna forma,  permitieron crear un perfil del paciente para que el médico,  pueda seleccionar el medicamento más apropiado,  para tratar la hipertensión arterial basándose en estas 14 variables.  De alguna forma,  convierten la prescripción,  en una prescripción bastante  precisa, ya que incorpora las 14 variables al mismo tiempo,  y es lo que llamamos en la actualidad Medicina de Pprecisión.

En la Medicina de precisión, buscamos que los tratamientos no sean tratamientos de carácter general para todos los pacientes, sino que sean tratamientos  cada vez más personalizados.

Los modelos que presento a continuación,  fueron desarrollados utilizando la herramienta Júpiter notebook la cual viene incluida, dentro de la suite de datos conocida como Aanaconda. Si está interesado en aprender , cómo instalar esta herramienta por favor siga el siguiente enlace

El modelo predictivo a su vez, fué  desarrollado utilizando la herramienta FLaSK  ,  la cual permite de manera interactiva utilizar el algoritmo «on line» .

Acceso a la notebook:

Acceso al modelo:

2.) Modelo para la realizar una PCR- digital ( covid19)

Este es un modelo supervisado , (de los que requieren entrenamiento) el cual está compuesto por un total de mas de 65000 casos,  con un conjunto de 53 variables divididas a su vez,  en variables que tiene relación con el perfil demográfico del paciente.

Hay luegpo otras variables que tienen relación con el perfil médico del paciente, y otro conjunto de variables que tienen relación, con los aspectos epidemiológicos.

Este modelo,  de ninguna forma pretende suplantar o reemplazar la prueba PCR-covid  de laboratorio , es solamente un modelo matemático, que puede aproximar al paciente a un diagnóstico cada vez más seguro .

Este modelo,  tiene la enorme ventaja,  de que el aprendizaje que va logrando adquirir de nuevos pacientes,  lo almacena sobre el aprendizaje previo,  lo que permite que la precisión final del algoritmo,  cada vez sea más elevada . El modelo tiene dos vertientes principales,  una vertiente que de alguna forma establece un puntaje o score con respecto a las respuestas del paciente que es el metodo convencional , y una segunda vertiente qué es la vertiente basada en inteligencia artificial , que es la que de acuerdo al aprendizaje adquirido predice,  si el paciente podría o no tener COVID.

Utilizando anaconda y Júpiter notebook como herramientas

Los modelos que presento a continuación,  fueron desarrollados,  utilizando la herramienta Júpiter notebook,  la cual viene incluida dentro de la suite de datos conocida como anaconda. Si está interesado,  en aprender cómo instalar esta herramienta por favor siga el siguiente enlace

El modelo predictivo,  a su vez fue desarrollado utilizando la herramienta flask ,  la cual permite de manera interactiva,  utilizar el algoritmo «on line» .

Acceso a la notebook:

Acceso al modelo (version castellano):

Acceso al modelo (versión catalán)  

3.) Modelo de predicción para inconciencia de pacientes con EPILEPSIA

Este es un modelo de pequeña escala,  que fue realizado en acompañamiento al trabajo de tesis de la doctora Susana Lara Meyer, realizado en Alemania en el año 2021.

El modelo pretende que,  con 46 variables,  las cuales se recolectaron de 189 pacientes,  se logre predecir,  el tiempo de inconsciencia que un paciente tendría luego de sufrir un ictus epiléptico.  ( es lo que en aprendizaje automático,  se conoce como capacidad de generalización del algoritmo).

Hemos utilizado las herramientas de Big Data, para hacer también una descripción estadistiva de los datos. De esta forma,  podremos entenderlos mejor y de alguna forma conocer el grado de importancia que tiene cada una de las variables, con respecto a las otras,  así como las asociaciones eventuales,  que existen entre las mismas.

Se aplicó un modelo de Machine learning, conocido como el Bosque aleatorio (Random Forest) , el cual es un algoritmo supervisado de de clasificación,  y que con una precisión aceptable,  a pesar del número tan pequeño de casos, nos permite conocer de manera predictiva el tiempo de inconsciencia posterior a un ictus para nuevos pacientes.

Aprendizaje no supervisado en epilepsia

También aplicamos,  para este conjunto de datos, un  modelo no supervisados de clusterizacion (  K-means )  el cual nos permitió clasificar la totalidad de los pacientes en cuatro grandes grupos, los cuales no siguen ninguna clasificación cultural tradicional, cómo por ejemplo:   no están divididos por sexo ni por edad ni por severidad del ictus, ni ninguna otra variable en particular, los métodos de agrupamiento  emplean todas las variables de manera simultánea para hacer esta clasificación.

Los modelos que presento a continuación,  fueron desarrollados utilizando la herramienta Júpiter notebook la cual viene incluida dentro de la suite de datos,  conocida como anaconda. Si está interesado en aprender,  cómo instalar esta herramienta por favor siga el siguiente enlace

El modelo predictivo a su vez, fué desarrollado utilizando la herramienta flask ,  la cual permite de manera interactiva utilizar el algoritmo «on line» .

Acceso a la notebook

Acceso al modelo predictivo "on line"

4.) modelo para el seguimiento de pacientes en sala de operaciones.

(Tiempo quirúrgico – tracking sala de operaciones )

Este es un modelo ficticio,  basado en un conjunto de datos previo, que fue debidamete  anonimizado, Este modelo, lo utilizamos como herramienta de capacitación para los estudiantes de grado y postgrado en la Universidad de Barcelona.

La idea con los estudiantes,  es que puedan adquirir destrezas en el manejo de sistemas de bases de datos, pero que adicionalmente,  puedan incorporar a las bases de datos,  herramientas novedosas para la analítica avanzada de datos, la cual suministra Python dentro de sus librerías Pandas, Mathlibpro, numpy, seaborn, entre otras.

Para el modelo de predicción, hemos utilizado las librerías de bosque aleatorio (Random Forest).  De esta forma,  el  modelo daría  a conocer  a los familiares de los pacientes en cirugía,  así como al personal de los servicios médicos involucrados sobre el tiempo esperado en quirófano y el tiempo remanente.

El sistema,  no solamente predice el tiempo quirúrgico,  sino que también predice el tiempo en recuperación. La precisión del algoritmo es bastante alta y utilizamos para ello la métrica del R2.

Los modelos que presento a continuación,  fueron desarrollados utilizando la herramienta Júpiter notebook,  la cual viene incluida dentro de la suite de datos conocida como Anaconda. Si está interesado en aprender,  cómo instalar esta herramienta por favor siga el siguiente enlace

El modelo predictivo a su vez,  fué desarrollado utilizando la herramienta flask ,  la cual permite de manera interactiva utilizar el algoritmo «on line» .

 

Acceso a la notebook


Acceso al modelo predictivo "on-line"

5.) Dashboard de la situación del covid 19 en Costa Rica

Este es un modelo,  que he venido desarrollando en mis ratos libres y con el cual,  la idea era presentar diariamente los datos con respecto al avance de la pandemia del COVID-19 en Costa Rica. El modelo en realidad toma los datos de diversas fuentes, a través de las técnicas de «scraping», y a partir de ahí presenta los resultados en pantalla.

Adicionalmente un conjunto de 12 modelos diferentes con base en la información capturada de fuetes oficiales , generan otra serie de gráficas y hacen las respéctivas proyecciones.

El cálculo del número R, también conocido como número reproductivo básico

Posiblemente una de las estadísticas,  más consultadas y más utilizadas se refieren al cálculo del número R (tasa de contagio). Este cálculo,  conlleva una serie de cálculos complejos basados en Ecuaciones Diferenciales , ya que también se realiza para todos los cantones,  y todos los distritos de Costa Rica de forma diaria.

Recientemente,  hemos incorporado a este conjunto de análisis:   el cálculo diario de las tasas de incidencia acumulada de 14 días,  por cada 100000 habitantes, y la tasa de incidencia acumulada de 7 días,  por cada 100000 habitantes.

Con ayuda,  de las bibliotecas de análisis espacial de Python,  conocidas como geo pandas y Bokeh, se calculan diariamente,  los números necesarios para alimentar los mapas de incidencia por cantón de forma comparativa.

Muchas de las predicciones que se realizan en el dashboard , vienen alimentadas del algoritmo prophet de Facebook,  el cual fue liberado años atrás para la población. Los datos que alimentan todo este conjunto de modelos,  son suministrados por el proyecto geovisión, un proyecto impulsado por la UNED y el Ministerio de salud de Costa Rica. Por último las estadísticas referentes a la vacunación,  también generan otra serie de indicadores y de mapas.

El modelo resultante del dashboard puede ser consultado en este enlace.

Una de las notebooks que se han venido utilizando para generar estos modelos está visible en:

La presente página ¿ Qué es un modelo de aprendizaje automático o de Machine Learning ? fué escrita por el Dr. Juan Ignacio Barrios, quien es médico y cirujano especialista en informática médica con un máster en Business Intelligence y consultoría tecnológica.

El Dr. Barrios aplica modelos de Big Data e inteligencia artificial en su trabajo diario como consultor, y en sus lecciones a nivel internacional y como profesor visitante de la cátedra de informática médica de la Universidad de Barcelona. Adicionalmente el Dr. Barrios es miembro de la facultad de Ginecología y Obstetricia de la Universidad de Rochester New York.  Tambien es miembro del cuerpo docente internacional de Algoritmia, el Instituto europeo de formación tecnológica.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

HTML Snippets Powered By : XYZScripts.com