El Filtrado colaborativo y los motores de recomendación
El Filtrado colaborativo y los motores de recomendación son una combinación de técnicas en la que participan algoritmos para encontrar coincidencias y recomendar elementos que tienen algunas relación . Las cosas relacionadas pueden ser articulo, pero podrida ser tambien cualquier cosa como un comportamiento, una dieta, un estilo de vida o cualquier fenomeno en el que existan relación . En resumen esta es una técnica que de alguna forma logra luego de utilizar el Machine Learning proponer recomendaciones de alguna forma personalizadas las cuales se adaptan de la mejor forma a las necesidades y características de un usuario.
El uso de los motores de recomendación es altamente apreciado por los comerciantes en línea condicionados por sus numerosas ventajas, las que iremos analizando mas adelante.
Que es un sistema de recomendación o filtrado colaborativo?:
Introducción a los sistemas de recomendación
El Filtrado colaborativo y los motores de recomendación son en términos sencillos, un software que filtra las opciones de los usuarios y les brinda las sugerencias más adecuadas en función de sus requisitos o preferencias.
El primer sistema de recomendación se creó en la década de 1970, en la comunidad de investigación de la Universidad de Duke; luego fue desarrollado por Xerox Palo Alto Research Center. Luego, Cuando apareció Internet en la década de 1990, los sistemas de recomendación se adoptaron de inmediato como la forma de ayudar a las personas a seleccionar los productos más adecuados entre una gran cantidad de opciones disponibles.
Desde entonces, los sistemas de recomendación se han vuelto cada vez más populares y ahora juegan un papel fundamental para las grandes empresas de Internet como Facebook, Amazon, Netflix, Google, YouTube y Tripadvisor, incursionando en los ámbitos de las redes sociales, el entretenimiento, el comercio electrónico, turismo, emparejamiento y más.
Veamos ahora las características de los motores de recomendación , explorando lo que implica construir, uno de alto rendimiento para que esté mejor equipado cuando decida cómo integrar esta funcionalidad en sus aplicaciones.
Los cuatro principios rectores de los sistemas de recomendación personalizados
Primero, dentro de El Filtrado colaborativo y los motores de recomendación debemos hacer una distinción entre los sistemas de recomendación personalizados y no personalizados . Con recomendaciones no personalizadas, todos los usuarios reciben las mismas recomendaciones. Algunos ejemplos de recomendaciones no personalizadas son películas populares, canciones exitosas recientes y restaurantes mejor calificados en un lugar determinado.
El objetivo operativo más obvio de usar un sistema de recomendación personalizado es recomendar artículos que sean relevantes para el usuario, ya que es más probable que las personas compren artículos que les parezcan atractivos.
El Filtrado colaborativo y los motores de recomendación deben lograr cuatro objetivos secundarios:
A. Arranque en frío. Cuando no hay suficiente información o metadatos disponibles, un motor de recomendación no funciona de manera óptima. Hay dos problemas (extremos) de arranque en frío: cuando no hay datos sobre un usuario, aca hay una falta de conocimiento previo sobre el visitante y no hay suficiente información de la sesión actual., Cuando no hay suficientes comentarios o calificaciones de los usuarios. Por ejemplo, supongamos que un visitante por primera vez busca un nuevo teléfono inteligente en un sitio de comercio electrónico. En una semana, compra uno y ya no está interesado en buscar teléfonos. ¿Qué debería mostrar ahora el motor de recomendaciones?
B. Superar la escasez de datos. La falta de datos surge del hecho de que los usuarios en un sitio web de comercio electrónico tienden a interactuar (agregar un artículo al carrito, comprar o revisar) con una cantidad limitada de artículos. La mayoría de los motores de recomendación agrupan calificaciones de usuarios similares; sin embargo, la matriz de usuario-elemento informada tiene hasta un 99 % de calificaciones vacías o desconocidas debido a la falta de incentivos para que el usuario califique los elementos o al conocimiento suficiente sobre un elemento para calificarlo. Como resultado, los usuarios que no brindan comentarios ni calificaciones reciben recomendaciones irrelevantes.
C. Escalabilidad Los problemas de escalabilidad han aumentado significativamente con el rápido crecimiento de la industria del comercio electrónico: se requieren motores de recomendación modernos para generar resultados en tiempo real para aplicaciones a gran escala. En otras palabras, el rendimiento del modelo de recomendación se mide en términos de rendimiento (número de inferencias por segundo) y latencia (tiempo para cada inferencia).
D. Diversidad y novedad Los resultados más precisos que pueden obtener los motores de recomendación se basan en la similitud de usuarios u objetos. Esto, sin embargo, expone al usuario a una selección más limitada de elementos (los populares), mientras que los elementos de nicho altamente relacionados pueden pasarse por alto. La diversidad de recomendaciones permite a los usuarios descubrir elementos que no encontrarían fácilmente.
Creación de una arquitectura escalable para un recomendador
Arquitectura de los sistemas de filtrado colaborativo
Desde el punto de vista de la ingeniería, para lograr los objetivos principales para los que fue construido, la arquitectura de un sistema de Filtrado colaborativo y los motores de recomendación debe ser escalable. Hay 8 componentes clave necesarios para lograr esto:
1. Fuentes de datos (DS)
Antes de sumergirse en las fuentes de datos, lo primero que debe comprender es la naturaleza implícita frente a la explícita de las calificaciones. Los comentarios en forma de calificaciones son explícitos porque los usuarios seleccionan valores numéricos en un sistema de evaluación específico (por ejemplo, un modelo de calificación de cinco estrellas) que especifica sus gustos y disgustos de varios elementos.
En la metodología implícita de recopilar comentarios, el comportamiento de navegación y compra de un usuario, o sus calificaciones unarias (por ejemplo, si «les gusta», «leen» o «miran»), en la que existe un mecanismo para expresar su afinidad por un elemento: se puede ver como una señal de calificación. Hoy en día, muchos sistemas comerciales permiten que la flexibilidad de brindar recomendaciones se base en comentarios explícitos e implícitos. Eso plantea la pregunta: «¿Cuáles son las mejores entradas para un motor de recomendación?» Como mínimo, querrá incluir usuarios, elementos y calificaciones explícitas (en una escala de cinco puntos):
USUARIOS/ARTÍCULOS | U1 | U2 | U3 | U4 | U5 |
I1 | 1 | ❓ | 3 | 4 | ❓ |
I2 | 3 | ❓ | ❓ | 2 | 3 |
I3 | 2 | 5 | 3 | ❓ | ❓ |
I4 | ❓ | 4 | 1 | ❓ | ❓ |
I5 | 5 | ❓ | 2 | ❓ | 5 |
Si bien en esta tabla faltan algunas calificaciones (indicadas por signos de interrogación), en realidad, menos del 1 % de los elementos se califican con frecuencia y se los puede denominar elementos populares. La gran mayoría rara vez se califica, lo que da como resultado una distribución muy sesgada de las calificaciones subyacentes; de hecho, estamos tratando con una propiedad de calificación de cola larga.
Hay dos fuentes principales de datos que se pueden tener en cuenta para un sistema de recomendación:
- Su CMS de acceso (como Shopify, Magento o WooCommerce) para el catálogo de productos (artículos) y los metadatos del usuario (p. ej., edad y sexo)
- Google Analytics (o cualquier plataforma de análisis de terceros) para interacciones como páginas vistas, tiempo en el sitio y conversiones
El conjunto de datos agregados podría verse así:
[
{
"user_id": "1",
"item_id": "100",
"events": [{
"event_1": "2016-04-20T13:25:55+02:00", //detail-page-view
"event_2": "2016-04-20T14:01:55+02:00", //add-to-cart
"event_3": "2016-04-20T14:13:55+02:00" //purchase
}]
},
{
"user_id": "2",
"item_id": "200"
},
{
"user_id": "3",
"item_id": "300"
}
]
Leer más sobre fuentes de datos
2. Ingeniería de Atributos (Feature Engineering)
Uno de los aspectos más importantes y lentos de la creación de modelos de aprendizaje automático (ML) es la preparación de datos y, específicamente, la extracción de características (o ingeniería ) . Todos lo sabemos: el 80% del trabajo del científico de datos es la preparación de datos.
La fase de extracción de características, en la que se extraen las descripciones de varios elementos, es muy específica de la aplicación. Los elementos pueden tener varios campos que describen sus diversos aspectos. Por ejemplo, una empresa de comercio electrónico que vende libros puede tener un campo Artículo, Título, Descripción, Autor y Precio.
Articulo | Título | Descripción | Autor | Precio |
I1 | Luego | Hijo de una madre soltera en apuros, Jamie Conklin solo quiere una infancia normal. Pero Jamie no es un niño ordinario. | Stephen King | $10.88 |
I2 | Empezamos por el final | Está ambientada en un pequeño pueblo, donde todos conocen el negocio de Star Radley, su adicción a las drogas, la forma en que se descuida a sus hijos, pero pocos le dan una mano, además de Walk, el sheriff local que tiene una historia con Star. | chris whitaker | $14.84 |
I3 | 2034: una novela de la próxima guerra mundial | De dos ex oficiales militares y autores galardonados, un thriller geopolítico escalofriantemente auténtico que imagina un enfrentamiento naval entre EE. UU. y China en el Mar de China Meridional en 2034, y el camino desde allí hacia una conflagración global de pesadilla. | Elliot Ackerman, almirante James Stavridis USN | $17.84 |
… |
Además de la información que describe cada elemento, algunos sistemas de recomendación también pueden necesitar atributos de usuario (por ejemplo, datos demográficos) además de los datos sobre las calificaciones de los usuarios (implícitas o explícitas).
Usuario | Ultima vez visto | Género | Años | País | Páginas vistas | Añadir al carrito | Valor del pedido |
U1 | 01/10/2021 | masculino | 45 | Canadá | 13 | 0 | 0 |
U2 | 28/02/2021 | mujer | 25 | nosotros | 5 | 1 | $129 |
U3 | 02/01/2021 | mujer | 39 | Francia | 9 | 1 | $98 |
… |
Para abordar este tedioso desafío en el ciclo de vida de ML, se introdujo el concepto de almacén de características: una interfaz entre la ingeniería de características y el desarrollo de modelos, un almacén de datos centralizado de características para equipos de ciencia de datos que resuelve dos problemas. Eso:
- Almacena grandes volúmenes de funciones de manera centralizada, lo que permite a los ingenieros de DS/ML reutilizar, experimentar y producir modelos de ML más rápido
- Sirve funciones con baja latencia y alto rendimiento a otras aplicaciones o bases de datos
No todos los sistemas de recomendación tienen un requisito estricto de una tienda de características; sin embargo, cuando los ingenieros de DS/ML trabajan en varias iniciativas de aprendizaje automático, la ingeniería de funciones manual puede causar redundancias. Entonces, ante todo, una tienda de funciones proporciona un único punto cierto para compartir todas las funciones disponibles.
Cuando un científico de datos comienza un nuevo proyecto, puede ir a este catálogo y encontrar fácilmente las características que está buscando. Pero una tienda de características no es solo una capa de datos; también es un servicio de transformación de datos que permite a los usuarios manipular datos sin procesar y almacenarlos como características listas para ser utilizadas por cualquier modelo de aprendizaje automático .
3. Modelos
Los modelos básicos para lEl Filtrado colaborativo y los motores de recomendación funcionan con dos tipos de datos: interacciones usuario-elemento, como calificaciones y comportamiento de compra, e información de atributos sobre usuarios y elementos, como perfiles textuales y palabras clave relevantes.
Estos son los modelos básicos del sistema de recomendación:
- Filtrado basado en contenido En los sistemas de recomendación basados en contenido, el contenido juega un papel principal en el proceso de recomendación. Las descripciones y los atributos de los artículos se aprovechan para calcular la similitud de los artículos. En este contexto, la matriz de calificaciones de los usuarios anterior se reemplaza por una matriz de contenido de elementos con elementos en las filas y atributos de elementos en las columnas.
- Filtrado colaborativo Los modelos de filtrado colaborativo utilizan el poder colaborativo de las calificaciones proporcionadas por múltiples usuarios para hacer recomendaciones. La idea básica es que las calificaciones no especificadas se pueden calcular porque las calificaciones observadas a menudo están altamente correlacionadas entre varios usuarios y elementos.
Veamos algunos ejemplos
Por ejemplo, considere a dos usuarios, Julia y John, que son amigos y tienen gustos muy similares. Si sus calificaciones, que ambos han especificado, son muy similares, el algoritmo subyacente puede identificar su similitud. En tales casos, es muy probable que las calificaciones en las que solo uno de ellos haya especificado un valor también sean similares. Esta similitud se puede utilizar para hacer inferencias sobre valores especificados de forma incompleta.
Hay dos tipos principales de filtrado colaborativo:
-
- Basado en el usuario La idea principal detrás del filtrado colaborativo basado en el usuario (User Base -Collaborative filtering F) es que las personas con características similares comparten gustos similares. Por ejemplo, si Julia está interesada en recomendarle una película a John, siempre que ambos hayan visto muchas películas juntos y las hayan calificado de manera casi idéntica, es seguro asumir que les seguirán gustando películas similares.
- Basado en elementos
A diferencia de UB-CF, el filtrado colaborativo elemento a elemento se basa en la similitud entre los elementos calculada, utilizando las calificaciones que los usuarios han dado a los elementos. Por lo tanto, las calificaciones de John de películas de ciencia ficción similares, como Alien y Predator, se pueden usar para predecir su calificación de Terminator.
4. Sistemas de recomendación híbridos
Hay escenarios en los que se pueden utilizar diferentes fuentes de entrada. Por ejemplo, los sistemas de filtrado colaborativo se basan en calificaciones de la comunidad, los métodos basados en el contenido se basan en descripciones textuales y las calificaciones del propio usuario objetivo, y los sistemas basados en el conocimiento se basan en las interacciones con el usuario en el contexto de una base de conocimiento. Del mismo modo, los sistemas demográficos utilizan los perfiles demográficos de los usuarios para realizar recomendaciones.
Cabe señalar que estos diferentes sistemas tienen diferentes fortalezas y debilidades. Algunos sistemas de recomendación, como los basados en el conocimiento, son más eficaces en entornos de arranque en frío en los que no se dispone de una cantidad significativa de datos.
Otros sistemas de recomendación, como los métodos colaborativos, son más efectivos cuando se dispone de grandes cantidades de datos. En muchos casos, cuando se dispone de una variedad más amplia de entradas, se tiene la flexibilidad de utilizar diferentes tipos de sistemas de recomendación para la misma tarea. En tales casos, existen muchas oportunidades para la hibridación: los diversos aspectos de los diferentes tipos de sistemas se combinan para lograr los mejores resultados.
El filtrado basado en contenido y el filtrado colaborativo a menudo se usan juntos porque se complementan bien. Los sistemas basados en contenido sufren de sobreespecialización: tienden a recomendar elementos que son similares a otros elementos que el usuario ha visto. Los recomendadores colaborativos, por otro lado, no pueden dar recomendaciones de manera efectiva para nuevos elementos. Los dos enfoques a menudo se combinan en sistemas de recomendación híbridos, obteniendo así lo mejor de ambos mundos.
Obtenga más información sobre los modelos híbridos .
5. Destinos y acciones
En este punto, puede generar recomendaciones, pero ¿cómo y dónde las usaría? Para un negocio de comercio electrónico, el enfoque estándar es mostrar un widget «Recomendado para usted» en la página de detalles del producto.
La idea detrás de mostrar primero los productos populares es que debido a que muchos compradores los han comprado, es muy probable que otras personas también estén interesadas en ellos.
Aunque este método realmente no personaliza la experiencia del cliente, mostrar artículos populares le permite dirigirse a usuarios nuevos que no tienen cuentas. A modo de comparación, así es como se vería la página de inicio de Etsy después de iniciar sesión:
La plataforma registró todas las vistas de productos anteriores y los elementos agregados a favoritos. Luego hacía correlaciones automáticas con productos similares de la misma categoría o vendedor.
El Filtrado colaborativo y los motores de recomendación también se pueden utilizar para la venta cruzada y la venta adicional, que tienen como objetivo ayudar a las personas a elegir los mejores artículos para ellos mientras aumentan los ingresos del comerciante.
Obtenga más información sobre predicciones y acciones del usuario.
6. Resultados comerciales y evaluación de un sistema de recomendación
Dado un conjunto de algoritmos de recomendación, ¿qué tan bien funcionan? ¿Cómo se puede evaluar su eficacia relativa?
Los desarrolladores se ocupan de los aspectos técnicos, pero los líderes empresariales aún tienen un papel importante: decidir la página en la que probar las recomendaciones de productos. Puede ser cualquier página, siempre que pueda recopilar suficientes datos. Preferiblemente, envíe la prueba solo al 20% de su tráfico para no romper las recomendaciones para todos si algo sale mal. Si desea probar de manera segura cualquiera de los sistemas de recomendación anteriores sin interferir con los datos en vivo, puede hacer que su equipo de datos o de desarrollo web realice pruebas en su entorno de pruebas.
En cualquier caso, preste atención a sus KPI y cómo les afecta una técnica individual. Si no ha realizado pruebas A/B, sus tasas de conversión y de clics para cada artículo, y no solo a nivel de toda la tienda, son dos opciones seguras con las que puede comenzar.
Tipos de motores
Entre las estrategias más usadas para crear El Filtrado colaborativo y los motores de recomendación encontramos:
1. Productos populares.
Otra forma útil de guiar a los usuarios para encontrar lo que quieren es mostrarles lo que la mayoría de las personas están buscando. Para decir lo menos, debe conocer sus productos más vendidos según sus datos de ventas. Sin embargo, podrá recomendar artículos incluso si no tiene los datos de sus clientes.
Una buena forma de utilizar este tipo de motor de recomendación es enviar los productos sugeridos en sus correos electrónicos de bienvenida.
En la medida en que en el tenor de la información sobre sus nuevos suscriptores, la manera más efectiva es agregar productos populares en sus correos electrónicos de bienvenida. Esta es una forma útil de adelantar y romper el hielo entre su marca y el cliente.
Por lo tanto, una forma sencilla de sacar el conocimiento del sistema su estructura de categorías para no utilizar categorías singulares para las recomendaciones de la página de categorías. Con la misma lógica, puede recomendar categorías secundarias a las principales, lo que proporciona una mayor diversidad de recomendaciones.
Para un aspecto más visual, basta con decir que, de acuerdo con la regla de Pareto en la comercialización, casi el 80% de las ventas provienen del 20% de los productos.
Teniendo en cuenta todas estas métricas, podrá definir perfectamente los productos más populares entre sus visitantes.
2. Recomendaciones basadas en la cuenta.
Una calificación alta de los usuarios es otra métrica popular. En realidad, las calificaciones, revisiones y comentarios de los usuarios se denominan «comentarios explícitos» en términos de motores de recomendación. Mientras que los hábitos de compra, clic y navegación se denominan “comentarios implícitos”. Este último es la interacción natural del usuario con la plataforma.
Es por eso que los motores de recomendación en su mayoría utilizan retroalimentación implícita basada en su riqueza, estructura y abundancia en contraste con las medidas, por ejemplo. Las áreas de información en el sector y no hay mucho beneficio de ellas.
De acuerdo investigación llevada a cabo por Bright Local. En consecuencia, el 88% de los usuarios considera que las revisiones son confiables y un paralelo de las recomendaciones personales. Por lo tanto, si cree que las preferencias basadas en la revisión de sus usuarios son un factor principal, considere agregar una función de «calificación máxima» a su página de inicio.
3. Recomendaciones personalizadas.
En función del historial de navegación y de la compra anterior, los widgets de recomendación muestran varios productos personalizados para los usuarios. Los algoritmos de recomendación usados aquí difieren con su implementación y los factores usados. El principal beneficio de la recomendación personalizada es que aumenta las ventas de productos de “cola ancha”.
Sin embargo, los sistemas de recomendación personalizados requieren una cantidad considerable de datos, que es imposible proporcionar a los nuevos visitantes. Este problema se denomina «problema de arranque en frío» de los motores.
Aquí, la mejor práctica de proporcionar una experiencia de usuario personalizada para los clientes que regresan y conocen nuevos usuarios, utiliza el «escenario alternativo». El nombre del Plan B. El nombre del Plan B se detecta si hay suficiente información sobre un cliente en particular para hacer recomendaciones. Si no hay suficientes datos, el sistema comenzará a «retroceder» a una lógica más general y más grande filtrada por categorías. Aquí, el motor utiliza metadatos en lugar de datos basados en el cliente.
Lo que es digno de mención es que el Plan B debe con gran conciencia para evitar recomendaciones irrazonables y proporcionar sugerencias precisas.
4. Productos similares.
En general, las sugerencias de productos similares se basan en varias lógicas. Uno de ellos es el filtrado basado en categorías, que es simple y se puede utilizar sin un motor de recomendación.
Combinado con la similitud basada en metadatos, este método de filtrado mejorará considerablemente el rendimiento de su tienda. Sin embargo, debe tener una sofisticada funcionalidad de recomendación en su sitio para esto.
Otra lógica del buen funcionamiento basada en la similitud es el «filtro colaborativo elemento a elemento», que veremos más de cerca.
5. «Cliente que compró / vio esto …» el filtrado colaborativo.
El filtrado colaborativo fue utilizado por primera vez por Amazon. El primer paso se dio en 1999, cuando presentó la patente inicial para el filtrado colaborativo. En la esencia del filtrado colaborativo, se recopila información sobre gustos y preferencias de los usuarios. El filtrado colaborativo puede implementarse tanto para la fijación basada en similitud como para la aprobación personalizada.
Recomendaciones de filtrado colaborativo artículo a artículo
La lógica de este tipo de referencia es determinar la similitud de los elementos en función de su frecuencia representada en el historial de compras el de navegador de los usuarios. En general, este tipo de widgets se nombran de la siguiente manera:
“Los clientes que vinieron también están aquí…”, que incluye la idea central del sistema de filtrado.
Los modelos de preferencias creados por El Filtrado colaborativo y los motores de recomendación son auténticos y específicos para su sitio y sus usuarios. Suelen contar las interacciones de los visitantes del sitio web y la plataforma.
6. Agregar a la página del carrito de compras.
Una forma efectiva de aumentar la cantidad y la calidad promedio de los pedidos, es agregar productos recomendados relacionados con un carrito determinado en las páginas del carrito.
Este tipo de recomendaciones serán efectivas y encontrarán al cliente en un buen estado psicológico, cuando esté dispuesto a comprar. Por lo tanto, existe la probabilidad de que digan «sí» a su sugerencia.
Sin embargo, algunas marcas fallan en el uso de esta recomendación, hay marcas que estando en la página del carrito de la compra se sugiere un producto más baratas.
Es un uso incorrecto del motor de recomendación, ya que hace que los clientes tengan dudas sobre su elección. Amazon usa esta clave de manera inteligente, y hay mucho más que aprender de ella. Mezclan varias estrategias para obtener el máximo beneficio de la compra. Utiliza las siguientes estrategias en una página, lo que se ha demostrado efectivo:
- Otros productos
- Venta cruzada
- Productos recomendados en el carro de compras de Amazon.
A la hora de optar por una plancha de carne, también te sugieren un set de cuchillos, en la sección de compras frecuentes. Los clientes que compraron estos también están comprando esta sección … recomiendan el fabricante de cuchillos de parrilla. y así sucesivamente.
7. Comprados juntos con frecuencia.
Otro tipo de recomendación altamente productiva es la “compra frecuente juntos”, que cambia en las páginas del carrito. Aquí, el proceso de pago debe dirigir a los clientes a la página del carrito, desde donde se hacen recomendaciones reales para que cualquier recomendación de la página del carrito dé resultados. Por otro lado, es una gran técnica de datos que requiere mucho esfuerzo e información del usuario.
El diseño de la página también juega un papel crucial. Puede proporcionar excelentes resultados y información a través de A / B probando varios diseños y diseños si tiene suficiente tiempo y recursos.
Por ejemplo, Netflix utiliza ampliamente este método de prueba para diseños de pantallas de inicio, programas destacados, etc. Es indudable que hay mucho más que aprender de ellos.
8. Visto recientemente.
En realidad, no se datos en profundidad sobre sus clientes para implementar este motor de recomendación. Se basa en productos con los que alguien se ha comprometido mientras navega por su sitio.
Puede utilizar esta técnica para navegar los correos electrónicos de abandono y la campaña de reorientación. El núcleo de este tipo de motor es enviar un recordatorio por correo electrónico a un cliente que se ha distraído mientras compra. Recordar a sus visitantes que vuelvan y continúen comprando una buena forma de conducir la conversión al sitio web.
El vecino mas cercano. KNN
Uno de los algoritmos más usado comúnmente en El Filtrado colaborativo y los motores de recomendación es el Nearest Neighborhood (KNN) . En una red social, un usuario particular usa un vecino con gustos e intereses similares que pueden ser encontrados calculándolos con la Pearson Correlation, colectando la data de preferencia de los primeros N-vecinos para un usuario en particular, (pesado por su similitud), con esa información se puede predecir la similitud.
¿Hacia donde avanza ésta tecnología ?
En esta etapa, no solo debería poder comprender los beneficios de usar El Filtrado colaborativo y los motores de recomendación, sino también tener una idea intuitiva sobre el mejor enfoque para su aplicación.
El propósito principal de los sistemas de recomendación de comercio electrónico basados en IA es ayudarlo a elegir los productos correctos para poner frente a sus usuarios. Todo está respaldado por datos reales sobre productos que les han gustado o en los que han mostrado interés anteriormente, por lo que ya no tendrá que adivinar qué podrían estar buscando.
El futuro de El Filtrado colaborativo y los motores de recomendación esta en los productos personalizados que le permitirá dirigirse a nuevos segmentos de usuarios y estar presente en todas partes: en las redes sociales, en las aplicaciones móviles, en el correo electrónico y, por supuesto, en su sitio web. Al mismo tiempo, podrá promocionar toda su gama de productos, incluidos los artículos nuevos, e incluso registrar datos sobre el comportamiento del usuario a medida que se produce. Entonces, si la popularidad de un producto de nicho aumenta repentinamente de la noche a la mañana, no tendrá que esperar hasta la mañana siguiente para actualizar sus recomendaciones porque todo esto se hace en tiempo real.
Conclusiones:
Como muchas veces en Data-Science una de las partes centrales para que el modelo funcione se centra en tener los datos correctos y un volumen alto. También es central el valor que utilizaremos como “rating” -siendo una valoración real de cada usuario ó un valor artificial que creemos adecuado-. Recuerda que me refiero a rating como ese puntaje que surge de la intersección entre usuario e ítems en nuestro dataset.
Luego será cuestión de evaluar entre las opciones de motores user-based, ítem-based y seleccionar la que menor error tenga. Esto se puedeevaluar tambien comparando el “mundo real” , y considerando los aciertos (o feedback) que dan los usuarios.
Existen algunas librerías que se utilizan para crear El Filtrado colaborativo y los motores de recomendación como “surprise”.
Por último, decir que -como en casi todo el Machine Learning- tenemos la opción de crear Redes Neuronales con Embeddings como recomendados y hasta puede que sean las que mejor funcionan para resolver esta tarea.
El presente artículo ha sido tomado de varias fuentes entre ellas: smarthint y Algolia, así como el blog de JI Bagnato, de la Wikipedia, y otras fuentes varias
El compilador de este articulo es el Dr. Juan Ignacio Barrios., quien es médico y cirujano, especialista en Informática de la salud, poseen un Master en Business Intelligence y consultoría tecnológica y también cursa el máster en Big Data y ciencia de datos de la Universidad Oberta de Catalunya UOC. El Dr. Barrios Arce, aplica modelos de aprendizaje automático e inteligencia artificial en su trabajo diario y actualmente colabora en la cátedra de informática médica en la Universidad de Barcelona, en calidad de profesor visitante . Es también faculty member de la Universidad de Rochester en los Estados Unidos y docente del Instituto europeo de formación tecnológica «Algoritmia»
.