Category / Blog / MachineLearning

    Loading posts...
  • How to show correlations between variables?

    When we work with linear regression we need to understand the relationship between the variables, that is, which variables depend on others, for this we analyze the correlation between the different variables that make up our dataset. Below is an example using ggally one of the many libraries that allow us to perform this analysis…

  • Market basket analysis: Example using grocery data

    Idea Our market basket analysis is based on the purchase data collected from one month of operation at a real-world grocery store. The data contains 9,835 transactions or about 327 transactions per day (roughly 30 transactions per hour in a 12-hour business day), suggesting that the retailer is not particularly large, nor is it particularly…

  • Black box: SVN – Support Vector Machines

    Idea Luego de analizar que significa SVN, vamos a ver la implementacion practica en un problema cotidiano: como funciona el reconocimiento de imagenes, y en particular vamos a intentar replicar el funcionamiento de los sistemas de OCR (Optical Character Recognition). Vamos a utilizar el dataset donado a la UCI Machine learning Data Reposity compuesto por…

  • Deep learning: Neural network

    Vamos a implementar una red neuronal utilizada para prediccion de valores. Idea Vamos a trabajar para poder predecir la fortaleza del concreto, si bien es un material amplisimamente utilizado, debido a que esta compuesto por una gran cantidad de materiales es dificil precedir su fortaleza en el producto final. El objetivo es predecir la fortaleza…

  • Multiple lineal regression (II) Improving the model

    En este post empezamos a trabajar con linear regression, en esta segunda parte vamos a trabajar para mejorar la performance de nuestro modelo, principalmente agregando relaciones entre variables. Mejorando el modelo Vamos a agregar tres nuevas relaciones a traves de la creacion de tres nuevas variables en nuestro dataset: Cambio de la variable edad de…

  • Multiple lineal regression (I)

    Cuando hablamos de modelos de regresion estamos hablando acerca de analizar relaciones entre variables numericas. Que es regresion? es entender las relaciones entre una variable dependiente (que sera el valor a ser predecido) y una o mas variables independientes (las variables predictoras). La forma mas simple de regresion asume una relacion lineal entre una variable…

  • Divide and conquer(II) : classification rules

    Classification rules representa conocimiento en forma de afirmaciones sencillas de si y no, de forma de poder asignarle una clase a ejemplos que no tienen una clasificacion (todavia). Rule learners son usados de forma similar a los arboles de desicion, de la misma forma que los arboles de desicion permiten ver como se estan estableciendo…

  • Divide and conquer(I) : classification using desicion trees

    En este post me gustaria desarrollar otros de los algoritmos necesarios para trabajar en problemas que impliquen clasificacion:  desicion trees y Rule Learners los cuales permiten transformar desiciones complejas en un set de opciones simples. Desicion trees Tal vez una de las tecnicas mas utilizada de machine learning, aplicable a casi cualquier tipo de datos…

  • Naive Bayes Algorithm

    Naive Bayes – a Not so Naive Algorithm Naive Bayes algorithm is called Naive because the algorithm makes a very strong assumption about the data having features independent of each other while in reality, they may be dependent in some way. Assumes that the presence of one feature in a class is completely unrelated to…

  • KNN algorithm

    Dime con quien andas y te dire quien eres KNN algorithm Definicion El algoritmo KNN es un algoritmo simple que almacena todos los casos disponibles y clasifica nuevos casos según una medida de similitud (por ejemplo, funciones de distancia). En este caso vamos a aplicar k-NN classification, donde nuestro output es poder clasificar a un objeto…