Resolução da questão 45 do Concurso do BRB TI

A resolução da questão 45 do BRB TI envolve uma técnica fundamental em análise de dados. Confira os detalhes!

Por
3 min. de leitura

A prova do BRB TI foi nesse domingo e trouxe duas questões de IA criadas pelo IADES. Vamos comentar agora a questão 45.

Texto hipotético para responder às questões 44 e 45:

João foi selecionado por sua chefe para liderar um projeto de criação de uma inteligência artificial que fizesse previsão de estoques. A chefe de João pediu que ele analisasse qual seria a melhor solução para o problema que apresentasse o menor custo computacional e que apresentasse uma justificativa adequada. Uma das opções consideradas seria a utilização de modelos já disponíveis, com algumas adaptações, ou treinar novos modelos utilizando bases de dados reais ou sintéticas.

Enunciado:

Ao analisar a base de dados, João notou que alguns registros estavam incompletos. Para resolver este problema, ele decidiu substituir os valores ausentes pela média dos valores disponíveis. Essa técnica é conhecida como:

(A) Adição por reforço.

(B) Substituição simples.

(C) Uso de ML imputation.

(D) Preenchimento de média.

(E) Verificação ativa.

A questão 45 aborda um problema comum em análise de dados: o tratamento de valores ausentes. Valores ausentes podem causar problemas significativos em modelos de aprendizado de máquina, afetando a qualidade e a precisão das previsões. Existem várias técnicas para lidar com dados faltantes, e a escolha da técnica adequada pode depender do contexto e da natureza dos dados.

Alternativa A: Adição por reforço

A adição por reforço não é uma técnica padrão conhecida para lidar com valores ausentes em bases de dados. Essa alternativa pode ser descartada, pois não se encaixa nas práticas comuns de imputação de dados.

Alternativa B: Substituição simples

A substituição simples é um termo genérico que poderia se referir a várias técnicas de imputação, como substituição pela média, mediana ou moda. Embora seja uma descrição válida de uma categoria de métodos, não especifica claramente a técnica utilizada por João.

Alternativa C: Uso de ML imputation

ML imputation (imputação por aprendizado de máquina) envolve o uso de algoritmos de aprendizado de máquina para prever e preencher valores ausentes com base em outros dados disponíveis. Embora essa seja uma técnica poderosa e sofisticada, não é o método descrito no cenário, onde João utiliza uma abordagem mais simples de substituição pela média.

Alternativa D: Preenchimento de média

Preenchimento de média é a técnica específica descrita na questão, onde os valores ausentes são substituídos pela média dos valores disponíveis para a respectiva variável. Esta técnica é simples e amplamente utilizada devido à sua facilidade de implementação e eficácia em muitos casos. No entanto, pode introduzir um viés se os dados não estiverem distribuídos normalmente ou se houver muitos valores ausentes.

Alternativa E: Verificação ativa

Verificação ativa não é uma técnica padrão para lidar com valores ausentes em análise de dados. Essa alternativa também pode ser descartada, pois não se relaciona com a prática de imputação de dados descrita.

Valores ausentes são comuns em bases de dados reais e podem ocorrer por vários motivos, como erros de entrada de dados, falhas em sistemas de coleta de dados ou omissão intencional de respostas. A presença de valores ausentes pode distorcer análises e comprometer a eficácia de modelos preditivos.

O tratamento de dados ausentes é uma etapa fundamental no processo de análise de dados e aprendizado de máquina. Dados ausentes podem surgir por diversos motivos, incluindo erros de entrada, falhas no sistema de coleta de dados ou omissões intencionais. Independentemente da causa, lidar adequadamente com esses valores é fundamental para garantir a integridade e a precisão das análises e dos modelos preditivos.

Existem várias técnicas para lidar com valores ausentes, cada uma com suas vantagens e desvantagens:

  1. Remoção de registros: Excluir registros com valores ausentes pode ser uma solução simples, mas pode resultar na perda de informações valiosas, especialmente se muitos registros estiverem incompletos.
  2. Preenchimento por média/mediana/moda: Substituir valores ausentes pela média, mediana ou moda é uma técnica fácil de implementar e pode ser eficaz quando a quantidade de dados ausentes é pequena. No entanto, pode introduzir viés e não capturar a variabilidade dos dados.
  3. Imputação por aprendizado de máquina: Algoritmos de aprendizado de máquina podem ser treinados para prever valores ausentes com base em outros dados disponíveis. Essa técnica é mais complexa, mas pode oferecer imputações mais precisas.
  4. K-nearest neighbors (KNN) imputation: Utiliza os valores de registros similares para imputar valores ausentes. É uma técnica mais avançada que pode capturar a relação entre variáveis, mas pode ser computacionalmente custosa.
  5. Múltipla imputação: Envolve criar várias imputações possíveis para os valores ausentes e analisar os resultados de forma conjunta. Essa técnica é robusta, mas complexa de implementar.

A escolha da técnica de imputação depende de vários fatores, incluindo a quantidade de dados ausentes, a distribuição dos dados e o impacto potencial do viés introduzido pela técnica de imputação. 

Métodos simples, como a substituição pela média, são úteis quando se precisa de uma solução rápida e prática, enquanto métodos mais avançados podem ser preferíveis quando a precisão é crítica.

Na questão 45 do concurso do BRB, a técnica descrita por João é o preenchimento de média, que é uma abordagem comum e simples para lidar com valores ausentes. 

No cenário descrito na questão 45 do concurso do BRB, João decidiu substituir os valores ausentes pela média dos valores disponíveis. Essa técnica, conhecida como preenchimento de média, é uma abordagem simples e frequentemente utilizada. 

Ao substituir os valores ausentes pela média, João garante que todos os registros tenham valores válidos, facilitando a análise subsequente. No entanto, essa técnica deve ser usada com cautela, pois pode introduzir um viés se os dados não estiverem distribuídos normalmente ou se houver muitos valores ausentes.

Quer ficar por dentro dos concursos públicos abertos e previstos pelo Brasil?
clique nos links abaixo:

Concursos Abertos

Concursos 2024

Receba gratuitamente no seu celular as principais notícias do mundo dos concursos!
clique no link abaixo e inscreva-se gratuitamente:

Telegram

Por
3 min. de leitura