|
--- |
|
language: |
|
- pt |
|
library_name: sklearn |
|
model_format: pickle |
|
model_file: model.pkl |
|
datasets: |
|
- fetch_california_housing |
|
pipeline_tag: tabular-regression |
|
tags: |
|
- Regressão |
|
- Califórnia |
|
- sklearn |
|
--- |
|
|
|
## Descrição do modelo: |
|
|
|
Este é um modelo de regressão linear treinado no conjunto de dados de habitação da Califórnia. O modelo foi treinado para prever o valor mediano das casas em um determinado bairro na Califórnia com base em várias características do bairro, como a renda média, a idade média da casa, o número médio de quartos, o número médio de ocupantes por casa, a latitude e a longitude. |
|
|
|
O modelo foi avaliado usando várias métricas de erro, incluindo o Erro Quadrático Médio (MSE), o Erro Absoluto Médio (MAE) e o Coeficiente de Determinação (R^2). Além disso, a validação cruzada foi usada para obter uma estimativa mais robusta do desempenho do modelo. |
|
|
|
Os coeficientes do modelo fornecem uma indicação da importância relativa de cada característica na previsão do valor mediano das casas. Por exemplo, um coeficiente positivo para a renda média sugere que bairros com maior renda média tendem a ter casas mais caras, enquanto um coeficiente negativo para a latitude sugere que bairros mais ao norte tendem a ter casas menos caras. |
|
|
|
Este modelo é um exemplo de um modelo de aprendizado de máquina simples e interpretable que pode ser usado como um ponto de partida para tarefas de previsão mais complexas. |
|
|
|
## Métricas de avaliação: |
|
|
|
Erro Quadrático Médio: 0.5558915986952441 |
|
|
|
Erro Absoluto Médio: 0.5332001304956565 |
|
|
|
Coeficiente de Determinação (R^2): 0.575787706032451 |
|
|
|
Erro Quadrático Médio Médio da Validação Cruzada: 0.5582901717686553 |
|
|
|
MedInc 0.852382 |
|
HouseAge 0.122382 |
|
AveRooms -0.305116 |
|
AveBedrms 0.371132 |
|
Population -0.002298 |
|
AveOccup -0.036624 |
|
Latitude -0.896635 |
|
Longitude -0.868927 |
|
|