8000 GitHub - armandoordonez/eda_couse
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

armandoordonez/eda_couse

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Análisis Exploratorio de Datos

¡Bienvenidos al curso de Análisis de Datos I!

El análisis exploratorio de datos (Exploratory Data Analysis – EDA) es una de las etapas más importantes del ciclo de vida de un proyecto de ciencia de datos e inteligencia artificial. Esta etapa abarca el entendimiento, la preparación y la descripción de los datos. De esta manera, el objetivo de esta etapa no solo es determinar si los datos recibidos permiten desarrollar el objetivo de investigación planteado en el proyecto, sino que también permite tomar decisiones en la formulación de hipótesis y la elección de metodologías y modelos de estimación. En tal sentido, las principales tareas que se llevan a cabo en esta etapa son: entender la estructura general de los datos, detectar anomalías, describir las características de las variables, explorar relaciones entre ellas, formular nuevas hipótesis e identificar tipos de modelos o metodologías para analizar la información. En un proyecto de ciencia de datos e IA se plantean objetivos de investigación, pero es el análisis exploratorio de datos el que permite conocer preliminarmente si dichos objetivos pueden ser alcanzados con los datos con que se cuentan.

Modulo 1 - Entendimiento general de los datos

Notebook Descripción Link Colab
1.0-Basic-Clasification.ipynb Descripción básica del flujo de tareas de un proyecto entrenamiento de un modelo de machine learning Open In Colab

Modulo 2 - Entender la forma de los datos

Notebook Descripción Link Colab
2.1-introduccion-carga-dataset-csv.ipynb Carga y lectura de archivos CSV Open In Colab
2.2-merge-datasets.ipynb Realizar un merge de datasets Open In Colab
2.3-merge_join-datasets.ipynb Combinar y unir un dataset Open In Colab
2.4-entendimiento-delos-datos Entender la estructura de los datos Open In Colab

Ejercicios Adicionales

Notebook Descripción Link Colab
2.2.1-carga-dataset-parquet.ipynb Carga y lectura de archivos CSV Open In Colab
2.2.2-ordernar-datasets.ipynb Ordenacion de un dataset por columnas Open In Colab
2.2.3-ejercicio-merge-join-US.ipynb Ejercicio de combinacion de Dataset Open In Colab
2.2.4-modificar-datasets.ipynb Modificar dataset Open In Colab

Quizz

Notebook Descripción Link Colab
2-quizz-MICE_imputation.ipynb Quizz Modulo2 https://colab.research.google.com/github/armandoordonez/eda_couse/blob/main/2-quizz-MICE_imputation.ipynb
2-quizz_data_preparation_cleaning.ipynb Quizz Modulo2 https://colab.research.google.com/github/armandoordonez/eda_couse/blob/main/2-quizz_data_preparation_cleaning.ipynb
imputación_y_modelado.ipynb.ipynb Quizz Modulo 2 https://colab.research.google.com/github/armandoordonez/eda_couse/blob/main/2-quizz-imputación-y-modelado.ipynb
2-quizz-eda-clasificacion.ipynb Quizz Modulo 2 https://colab.research.google.com/github/armandoordonez/eda_couse/blob/main/2-quizz-eda-clasificacion.ipynb
2-quizz-eda-regresion.ipynb Quizz Modulo 2 https://colab.research.google.com/github/armandoordonez/eda_couse/blob/main/2-quizz-eda-regresion.ipynb
2-quizz-ejercicios-de-merge.ipynb Quizz Modulo 2 https://colab.research.google.com/github/armandoordonez/eda_couse/blob/main/2-quizz-ejercicios-de-merge.ipynb

Modulo 3 - preparación de Datos

Notebook Descripción Link Colab
3.0-Impacto-one-hot-encoding-y-label-encoding.ipynb Uso de One Hot Encoding y Label Encoding Open In Colab
3.1-Estandarizacion-Normalizacion.ipynb Aplicación de Estandarización y Normalización Open In Colab
3.2-label-encoding.ipynb Label Encoding Open In Colab
3.3-Loan-Prediction.ipynb Taller de Correlaciones Open In Colab
3.4-Practica-Selección-de-Variables.ipynb Selección de Variables Open In Colab
3.5-Pipeline-1.ipynb Practica de Pipelines Open In Colab
3.6-Pipeline-2.ipynb Practica de Pipelines Open In Colab
3.7-Pipeline-Linear-Regression.ipynb Pipeline de un modelo Open In Colab
3.9-Pipeline-Experiment.ipynb Pipeline usando Transformers Open In Colab
3.10-Taller-Data-Leakage.ipynb Taller de Fuga de Datos Open In Colab

Ejercicios Adicionales

Notebook Descripción Link Colab
3-Imbalanced-Dataset.ipynb Métodos para Datos Desbalanceados Open In Colab
3-Tutorial_Descomposición-Series-De-Tiempo.ipynb Series de Tiempo Open In Colab
3-Time-Series.ipynb Series de Tiempo Open In Colab
3-Regresion-Logistica.ipynb Regresion Logistica Open In Colab
3-Custom-Transformers.ipynb Uso de Transformers Personalizados Open In Colab
3-Column-Transformers.ipynb Modificando Columnas con Transformers Open In Colab
3-Basic-Pipelines.ipynb Tuberias de Datos Básicas Open In Colab
3-Basic-Pipeline-Custom.ipynb Tuberias de Datos Personalizadas Open In Colab

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  
0