La Tabla Periódica de la Ciencia de Datos

Consultores estratégicos en Ciencia de Datos

La Tabla Periódica de la Ciencia de Datos

Imagen relacionada

Usualmente cuando hacemos alguna investigación y utilizamos datos tenemos la tendencia de utilizar únicamente los datos que hemos recolectado.  Cada vez es mas común usar ademas datos de fuentes externas,  lo cual  tiene mucha lógica considerando el repositorio de BIG DATA que es el Internet.

La “tabla periódica de la Ciencia de datos “ que aparece a continuación, y que ha sido elaborada por DATACAMP,  es una colección valiosisima de más de 150 empresas,  herramientas y otros recursos que componen  la industria de las ciencias de los datos. Sin duda esta tabla tambien es una  guía para navegar para utilizar los datos de otros “actores clave” en el mundo de la ciencia de datos.  Los recursos de la tabla se eligieron a través de encuestas  realizadas a los usuarios de ciencias de datos, como la Encuesta Salarial de Ciencia de Datos 2016 de O’Reilly, el Cuadrante Mágico 2017 para Plataformas de Ciencia de Datos de Gartner y los resultados de la Encuesta de Software de KDnuggets 2016 , entre algunas otras fuentes. Las categorías en la tabla no son todas mutuamente excluyentes. ( por tanto se pueden usar de una y otra fuente concomitantemente.) 

Resultado de imagen de "ciencia de datos"
Consulte la tabla periódica completa de ciencia de datos, con hipervínculos, a continuación:

En la parte izquierda de la tabla se enumeran las empresas que tienen que ver con la educación:  aquí encontrará cursos, campamentos de entrenamiento y conferencias. En el lado derecho, por otro lado, encontrará recursos que lo mantendrán al día con las últimas noticias, los blogs más populares y material relevante en la comunidad de ciencia de datos. En el medio, encontrará herramientas con las que podría comenzar a trabajar en el mundo de la ciencia de datos: encontrará lenguajes de programación, proyectos y desafíos, herramientas de visualización de datos, etc.

www.datacamp.com  

La tabla incluye recursos, las herramientas y las empresas de ciencia de datos divididas en 13 categorías:

Cursos: para aquellos que buscan aprender ciencia de datos, hay un montón de sitios (empresas) que ofrecen cursos de ciencia de datos. Aquí encontrará varias opciones que probablemente se adapten a su estilo de aprendizaje: DataCamp para aprender haciendo, MOOC como Coursera y Edx , 

Boot camps: esta sección incluye recursos para aquellos que buscan más opciones de sitios que apoyan los científicos de datos “mentoring sites”. Acá a tenemos boot camps para practicar  como The Data Incubator o Galvanize .

Conferencias: El aprendizaje no sólo se hace en el aula , cursos virtuales o en los campamentos. Es importante hacer estos cursos  como aspirantes a ciencias de datos .   De esta forma se pondrá en contacto con los últimos avances y los mejores expertos de la industria. ¡Algunos de los que se enumeran en la tabla son UseR! Tableau Conference y PyData .

Datos: Practicando se aprende , y esto es igual en la ciencia de datos. Acá se puede buscar y encontrar conjuntos de datos para comenzar a practicar lo que se aprende  en los cursos sobre datos en la vida real o bien para hacer su  propia biblioteca de datos científicos. Los datos son el componente básico de la ciencia de datos y el descubrimiento de que los datos pueden ser probablemente una de las cosas más difíciles pero apasionantes . Algunas de las opciones que puede considerar cuando busca conjuntos de datos geniales son data.world , Quandl y Statista .

Proyectos y desafíos, concursos: después de la práctica, también puede considerar la posibilidad de asumir proyectos más grandes: carteras de ciencia de datos, competiciones, desafíos … ¡Encontrará todos estos en esta categoría de la tabla periódica de datos científicos! Una de las opciones más populares es probablemente Kaggle , pero también vale la pena consultar DrivenData o DataKind .

Lenguajes y distribuciones de programación: los científicos de datos generalmente usamos no sólo uno sino muchos lenguajes de programación; Algunos lenguajes de programación como Python han ganado recientemente mucha tracción en la comunidad y también las distribuciones de Python, como Anaconda , parecen encontrar su camino hacia los aspirantes a ciencias de datos.

Administración de búsqueda y datos: esta categoría enorme contiene todas las herramientas que pueden usarse para buscar y administrar sus datos de muchas maneras. Pero ademas tendrá una biblioteca de búsqueda como Lucene ,  y algo “super util”  como la integración y administración de bases de datos relacionales como Oracle .

Aprendizaje automático y estadísticas: esta categoría no solo le ofrece bibliotecas para comenzar con aprendizaje automático y estadísticas con lenguajes de programación como Python, sino también plataformas enteras, como Alteryx o DataRobot .

Visualización e informes de datos: después de haber analizado y modelado sus datos, es posible que esté buscando visualizar los resultados e informar sobre lo que ha estado investigando. Puede hacer uso de opciones de código abierto como Shiny o Matplotlib para hacer esto, o todas las opciones comerciales como Qlikview o Tableau .

Colaboración: la colaboración es un tema de tendencia en la comunidad de ciencia de datos. A medida que uno va creciendo en esta locura, sentirá la necesidad de trabajar en equipo (¡incluso si es solo con otra persona!) Y en esos casos,  puede utilizar cuadernos como Jupyter . Pero incluso cuando solo trabajas por tu cuenta, trabajar con un IDE puede ser útil si estás empezando. En tales casos, considere Rodeo o Spyder .

Comunidad y Preguntas y Respuestas: hacer preguntas y recurrir a la comunidad es una de las cosas que probablemente usará  mucho cuando esté trabajando en el campo de la ciencia de datos. Si alguna vez no está seguro de dónde puede encontrar la respuesta a su pregunta sobre la ciencia de datos, puede estar seguro de encontrarla en sitios como StackOverflow , Quora , Reddit , etc.

Noticias, boletines y blogs: encontrará que la comunidad está evolucionando y creciendo rápidamente.  Seguir  las noticias y las últimas tendencias es una necesidad. Acá están los enlaces a Boletines informativos generales como Data Science Weekly o Data Elixir o boletines informativos específicos del idioma como Python Weekly o R Weekly .   Estos boletines pueden brindarle su “dosis semanal” de ciencia de datos.  Vale  la pena seguir los sitios de blogs como R-Bloggers o KDnuggets ! (Tenga en cuenta que estos dos también tienen boletines que puede suscribirse para mantenerse al día con lo último en la comunidad de ciencia de datos).

Podcasts: por último, y no menos importante, son los podcasts. Hay enlaces excelentes en muchos sentidos, ya que presentan entrevistas de expertos, como Becoming A Data Scientist o temas específicos de ciencia de datos, como en Data Stories o Talking Machines .

En resumen, la ciencia de datos no solo se trata de utilizar,  sino también de compartir y esta colección  de enlaces de manera tan estructurada son un excelente modo de considerar todas las aristas de nuestro trabajo.

Resultado de imagen de "ciencia de datos" Buena Suerte en sus investigaciones. [powr-comments id=bbc9ba0f_1528026449676]            ]]>

Tags:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *