KNN para concursos! Um dos algoritmos mais cobrados em Machine Learning!

Hoje vamos falar sobre o algoritmo KNN, um método de classificação em aprendizado de máquina que é muito cobrado em concursos públicos.

Por
3 min. de leitura

KNN para concursos! Um dos algoritmos mais cobrados em Machine Learning!

Fala, galera! Tudo bem? Hoje vamos falar sobre o algoritmo KNN, um método de classificação em aprendizado de máquina que é muito cobrado em concursos públicos. Se você é um aluno ou aluna concurseiro (ou concurseira) que está estudando sobre Aprendizado de Máquina, este artigo é para você.

O KNN, que significa k-nearest neighbors, é um algoritmo de classificação baseado em instâncias. Ele classifica um ponto com base nos pontos de treinamento mais próximos a ele. O número de pontos de treinamento que são usados para a classificação é definido pelo valor de k. É o famoso “me dizes com quem andas, que te direi quem és”.

O KNN é bastante utilizado em problemas de classificação, como reconhecimento de dígitos manuscritos, classificação de texto, entre outros. Ele também é um algoritmo simples de entender e implementar.

Para utilizar o KNN, é necessário realizar algumas etapas. Primeiro, é preciso definir a medida de distância entre os pontos. Em seguida, é necessário escolher um valor de k e selecionar os k pontos mais próximos ao ponto a ser classificado. Por fim, é necessário atribuir uma classe ao ponto a ser classificado com base nas classes dos k vizinhos mais próximos.

Uma das vantagens do KNN é que ele pode ser utilizado em problemas de classificação com múltiplas classes. Além disso, ele é um modelo não paramétrico, o que significa que ele não faz nenhuma suposição sobre a distribuição dos dados.

No entanto, o KNN também possui algumas desvantagens. Uma delas é que ele pode ser bastante sensível à escala dos atributos, o que significa que é necessário normalizar os dados antes de utilizá-lo. Além disso, o KNN pode ser bastante lento em problemas com muitos dados de treinamento.

É importante lembrar que o KNN é um algoritmo supervisionado, ou seja, ele precisa de um conjunto de dados rotulados para ser treinado. Além disso, é importante escolher um valor de k adequado para cada problema específico.

O KNN também pode ser utilizado em problemas de regressão, onde ele estima o valor de uma variável contínua com base nos valores das variáveis independentes dos k pontos mais próximos.

Uma das desvantagens do KNN é que ele pode ser afetado por pontos de treinamento mal rotulados. Por isso, é importante ter cuidado na hora de rotular os dados.

O KNN é um algoritmo bastante popular em concursos públicos, principalmente em questões de análise de dados e aprendizado de máquina. Por isso, é importante estar familiarizado com esse método e saber como aplicá-lo em diferentes situações.

Uma dica importante é praticar bastante a implementação do algoritmo e a interpretação dos resultados obtidos. Isso pode ser feito através de exercícios em plataformas de programação, como o Kaggle, ou com a ajuda de livros e materiais de estudo.

Outra dica é ficar atento aos detalhes na hora de escolher a medida de distância e o valor de k para cada problema específico. Pequenas mudanças nesses parâmetros podem ter grande impacto nos resultados.

Por fim, é importante estar sempre atualizado sobre as últimas tendências e avanços em aprendizado de máquina e análise de dados. O mundo da tecnologia está em constante evolução e é preciso estar preparado para lidar com novos desafios.

Vamos praticar um pouco com questões:

Prova: CESGRANRIO – 2021 – Banco do Brasil – Agente de Tecnologia

Um pesquisador conseguiu uma base de dados que mostrava terrenos classificados de acordo com:

  • características físicas; • tipo de negócio a ser nele implantado; • risco esperado, que compreendia os rótulos alto, médio, baixo ou nenhum.

Decidiu, então, usar um algoritmo de aprendizado de máquina que, a partir das características físicas do terreno e do tipo de negócio a ser nele implantado, aprenderia a determinar o risco esperado, enquadrando o terreno em questão em um daqueles rótulos.

Nesse cenário, que algoritmo de aprendizado de máquina é indicado para resolver esse problema?

A PCA 

B K-NN 

C DBSCAN 

D K-Medoids 

E Redes de Kohonen

Gabarito: B.

Comentários: O PCA é um algoritmo não supervisionado utilizado em problemas de redução de dimensionalidade. O KNN é um algoritmo supervisionado para tarefas de classificação. É, portanto, nosso gabarito. DBSCAN, K-Medoids e as redes de Kohonen são também algoritmos não supervisionados, usados em problemas de agrupamento.

Prova: CESPE / CEBRASPE – 2021 – SEFAZ-AL – Auditor Fiscal de Finanças e Controle de Arrecadação da Fazenda Estadual

O método k-NN (k-nearest neighbors) é um dos classificadores não paramétricos baseados em distância.

Gabarito: Verdadeiro.

Comentários: O KNN é usado em problemas de classificação, é um modelo não paramétrico (não pressupõe a utilização de uma função matemática para criar o formato do modelo) e classifica os dados com base na distância entre os vizinhos mais próximos.

Espero que esse artigo tenha sido útil para vocês e que tenha ajudado a entender melhor o funcionamento do algoritmo KNN. Lembre-se sempre de estudar com dedicação e persistência, e boa sorte nos seus estudos e concursos públicos!


Quer ficar por dentro dos concursos públicos abertos e previstos pelo Brasil?
Clique nos links abaixo:

CONCURSOS ABERTOS

CONCURSOS 2023

Receba gratuitamente no seu celular as principais notícias do mundo dos concursos!
Clique no link abaixo e inscreva-se gratuitamente:

TELEGRAM

Por
3 min. de leitura