Reinforcement Learning wird häufig außerhalb der Kategorien Supervised und Unsupervised gesehen, da es gewissermaßen beide Ansätze miteinander verbindet. Algorithmen dieser Kategorie suchen ihre eigenen Strategien um zu lernen, und werden dann durch Feedback belohnt. Ein Beispiel für Reinforcement Learning ist Googles AlphaGo.