## Aprendizado Supervisionado, Não Supervisionado e Aprendizado por Reforço
Ao embarcar na criação de um modelo de aprendizado de máquina, uma das primeiras escolhas que você precisará fazer é o tipo de abordagem de aprendizado a ser usada. Essa decisão depende do tipo de dados que você possui e do problema que está enfrentando. Aqui está uma análise simples dos três principais tipos de aprendizado: Aprendizado supervisionado, não supervisionado e por reforço.
### Aprendizado supervisionado
- **Como aprender com um professor** - Você fornece ao modelo dados e as respostas corretas (rótulos) para cada ponto de dados, como mostrar uma imagem de um gato e dizer ao modelo que é um gato.
- **Quando usar -** Se você rotulou dados e deseja que o modelo aprenda a resposta certa com esses dados.
- **Exemplos-** Classificação de imagens, reconhecimento de fala, tarefas de carro autônomo, como identificação de pedestres, detecção de fraude bancária.

**O aprendizado**
supervisionado usa dados rotulados para treinar o modelo
### Aprendizado não supervisionado
- **Aprendendo por conta própria -** O modelo explora muitos dados por conta própria para encontrar padrões e estruturas, semelhante a resolver um quebra-cabeça sem ver a imagem na caixa.
- **Quando usar -** Se você tiver dados não rotulados e quiser que o modelo encontre padrões ou estruturas nos dados.
- **Exemplos** - Gerar novas músicas, escrever código, lidar com conjuntos de dados massivos com dados não rotulados.

O aprendizado
**não supervisionado** usa dados não rotulados e o modelo encontra os padrões
### Aprendizado por reforço
- **Aprendendo por tentativa e erro -** O modelo aprende interagindo com um ambiente, recebendo recompensas por ações corretas e penalidades por ações erradas, assim como treinar um animal de estimação.
- **Quando usar -** Quando você deseja que seu modelo aprenda com suas interações e comentários, sem precisar de dados rotulados.
- **Exemplos-** Jogar videogame, robótica, tomada de decisão em tempo real em carros autônomos.

**O aprendizado**
por reforço usa recompensas e penalidades (tentativa e erro) para aprender comportamentos para o sucesso
Em problemas mais complexos do mundo real, uma mistura desses tipos de aprendizado pode ser empregada, com vários modelos, cada um lidando com tarefas específicas, como uma equipe de especialistas trabalhando juntos em direção a um objetivo comum.