top of page

Parte 01: Comenzando con IA y Regresión en Microsoft Fabric

Updated: Apr 2

En los últimos años, la inteligencia artificial (IA) ha pasado de ser un tema académico a convertirse en una herramienta clave en los procesos empresariales, especialmente en áreas como finanzas, salud, manufactura y retail. Sin embargo, para muchas personas, los conceptos detrás de la IA pueden parecer abstractos o demasiado técnicos. Este post marca el inicio de una serie práctica, donde desmitificamos estos conceptos y los llevamos a la acción utilizando Microsoft Fabric y notebooks integrados con PySpark.


¿Qué es la Inteligencia Artificial?

La IA es un conjunto de tecnologías que permite que las máquinas simulen capacidades humanas como el razonamiento, el aprendizaje o la toma de decisiones. Dentro de ese gran paraguas, uno de los componentes más importantes es el machine learning (aprendizaje automático).


¿Qué es el Machine Learning?

El machine learning es una rama de la IA que permite que los sistemas aprendan a partir de datos en lugar de ser programados explícitamente para cada tarea. Se trata de construir modelos que reconocen patrones y hacen predicciones o decisiones basadas en la información que se les provee.


Existen tres grandes categorías de algoritmos de machine learning:


  • Aprendizaje supervisado: se entrena con datos etiquetados (por ejemplo, datos históricos donde conocemos el resultado).

  • Aprendizaje no supervisado: se trabaja con datos sin etiquetas, buscando agrupaciones o estructuras ocultas.

  • Aprendizaje por refuerzo: los modelos aprenden a través de ensayo y error, como en los videojuegos o en robótica.


¿Qué es un algoritmo supervisado?

En esta serie nos enfocaremos en el aprendizaje supervisado, más específicamente en un problema de regresión. Un algoritmo supervisado trabaja con pares de entrada/salida para aprender una relación. Por ejemplo:


  • Entrada: años de experiencia

  • Salida esperada: salario


El modelo aprende cómo se relacionan estas dos variables para luego poder predecir el salario de alguien nuevo solo con saber sus años de experiencia.


¿Qué es un problema de regresión?

Los problemas de regresión son aquellos donde el objetivo es predecir un valor numérico continuo. Algunos ejemplos comunes son:


  • Predecir ingresos, precios, temperaturas, consumo de energía, etc.

  • Estimar costos operativos.

  • Predecir ventas futuras.


Este tipo de problema es muy frecuente en la industria y representa una puerta de entrada ideal para quienes quieren comenzar a aplicar machine learning en la práctica.


¿Por qué usar Microsoft Fabric?

Microsoft Fabric es una plataforma moderna, unificada y completamente en la nube que integra herramientas de análisis, ingeniería de datos y machine learning en un solo lugar. Gracias a sus notebooks integrados con PySpark, podemos:


  • Escribir código Python en notebooks sin configuración adicional.

  • Conectarnos a datos estructurados o no estructurados de forma nativa.

  • Entrenar modelos de IA directamente sobre esos datos.

  • Visualizar, exportar o automatizar resultados sin cambiar de plataforma.


¿Qué haremos en esta serie?

  • Crear un conjunto de datos desde cero para simular aumentos salariales anuales.

  • Construir un modelo de regresión lineal simple para predecir salarios en función de la experiencia.

  • Evaluar el desempeño del modelo.

  • Optimizarlo usando técnicas como Grid Search para encontrar los mejores hiperparámetros.

  • Visualizar los resultados y aprender buenas prácticas.


***Este contenido fue potenciado con IA. Porque cuando el conocimiento humano se encuentra con la inteligencia artificial, surgen mejores ideas.***




Comments


Empoderando a los entusiastas de los datos en América Latina

Connect with Us

  • YouTube
  • Facebook
  • TikTok
  • Twitter

© 2023 BI LATAM. All Rights Reserved.

bottom of page