viernes, 17 de noviembre de 2023

CLASE_15_11


USO DE NUMPY, PANDAS, MATPLOTLIB.PYPLOT, DATETIME
Describe las características e instalación de las librerías Pandas, Numpy y Matplotlib en colaboración con Google.

Las librerías Pandas, Numpy y Matplotlib son herramientas esenciales en el mundo del análisis de datos y la visualización en Python, y son ampliamente utilizadas en Google Colab, una plataforma basada en la nube para escribir y ejecutar código Python. Aquí te describo brevemente cada una y cómo puedes instalarlas en Google Colab:

pandas

  1. Características :

    • Es una librería para manipulación y análisis de datos.
    • Proporciona estructuras de datos rápidas, flexibles y expresivas (como DataFrame) diseñadas para trabajar con datos "relacionales" o "etiquetados" de manera fácil e intuitiva.
    • Ofrece herramientas para leer y escribir datos entre estructuras de datos en memoria y diferentes formatos de archivo como CSV, Excel, bases de datos SQL, entre otros.
  2. Instalación en Google Colab :

    • Pandas generalmente viene preinstalado en Google Colab.
    • Para usarlo, simplemente importa la librería en tu cuaderno de Colab: import pandas as pd.

numpy

  1. Características :

    • Es una librería para el cálculo científico en Python.
    • Proporciona un objeto de matriz multidimensional de alto rendimiento y herramientas para trabajar con estas matrices.
    • Es fundamental para la computación científica con Python, incluyendo un poderoso objeto de matriz N-dimensional, funciones sofisticadas, herramientas para integrar código C/C++ y Fortran, y capacidades de álgebra lineal.
  2. Instalación en Google Colab :

    • Al igual que Pandas, Numpy también suele estar preinstalado.
    • Para usarlo, simplemente importa Numpy: import numpy as np.

Matplotlib

  1. Características :

    • Es una librería para crear visualizaciones estáticas, animadas e interactivas en Python.
    • Permite generar gráficos, histogramas, espectros de potencia, gráficos de barras, diagramas de error, diagramas de dispersión, etc., con solo unas pocas líneas de código.
    • Ampliamente utilizado para la visualización de datos y el apoyo gráfico en la exploración de datos.
  2. Instalación en Google Colab :

    • Generalmente, Matplotlib también está preinstalado en Colab.
    • Para importarlo, EE.UU.: import matplotlib.pyplot as plt.

Instalación de Versiones Específicas (Opcional)

Si necesita una versión específica de cualquiera de estas librerías en Google Colab que no esté preinstalada, puede instalarla usando pip. Por ejemplo, para instalar una versión específica de Pandas, usarías:

!pip install pandas==[version]

Reemplace [version]con la versión específica que necesita.

En resumen, Pandas, Numpy y Matplotlib son herramientas fundamentales en el análisis de datos con Python, y su uso en Google Colab facilitan el trabajo en la nube sin preocuparse por la instalación local de estas librerías. Su integración y facilidad de uso hacen de Colab una excelente plataforma para la ciencia de datos y la investigación.




GENERAR DATOS ALEATORIOS PARA LAS VENTAS DIARIAS EN UN MES

pip install pandas
pip install numpy

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import datetime

# Generar datos aleatorios para las ventas diarias en un mes
np.random.seed(0)  # Para resultados reproducibles
ventas_diarias = np.random.randint(100, 500, 30)

# Crear un rango de fechas para un mes
fechas = pd.date_range(start="2023-01-01", end="2023-01-30")

# Crear un DataFrame de Pandas
datos = pd.DataFrame({
    'Fecha': fechas,
    'Ventas': ventas_diarias
})

# Establecer la columna de fecha como índice
datos.set_index('Fecha', inplace=True)

# Mostrar las primeras filas del DataFrame
print(datos.head())

# Visualizar los datos con Matplotlib
plt.figure(figsize=(10, 6))
plt.plot(datos.index, datos['Ventas'], marker='o', color='b')
plt.title("Ventas Diarias en Enero 2023")
plt.xlabel("Fecha")
plt.ylabel("Ventas")
plt.xticks(rotation=45)
plt.grid(True)
plt.show()

RESULTADOS
           Ventas
Fecha             
2023-01-01     272
2023-01-02     147
2023-01-03     217
2023-01-04     292
2023-01-05     423

Genera el grafico de ventas diarias:


Desarrolla un ejemplo de estadística inferencial mediante un script en Python empleando las bibliotecas de Pandas, Numpy y Matplotlib.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.stats import ttest_ind

# Configurar la semilla para la reproducibilidad
np.random.seed(0)

# Generar datos de ventas aleatorios para dos meses diferentes
# Supongamos que estos datos representan las ventas diarias
ventas_mes1 = np.random.normal(300, 50, 30)  # Media 300, desviación estándar 50, 30 días
ventas_mes2 = np.random.normal(280, 40, 30)  # Media 280, desviación estándar 40, 30 días

# Crear DataFrames para cada mes
datos_mes1 = pd.DataFrame({'Mes': 'Enero', 'Ventas': ventas_mes1})
datos_mes2 = pd.DataFrame({'Mes': 'Febrero', 'Ventas': ventas_mes2})

# Combinar los DataFrames
datos_combinados = pd.concat([datos_mes1, datos_mes2])

# Realizar una prueba t para comparar las medias de ambos meses
t_stat, p_val = ttest_ind(ventas_mes1, ventas_mes2)

# Imprimir los resultados de la prueba t
print("Estadística t:", t_stat)
print("Valor p:", p_val)

# Visualización
plt.figure(figsize=(10, 6))
plt.hist(ventas_mes1, alpha=0.5, label='Enero')
plt.hist(ventas_mes2, alpha=0.5, label='Febrero')
plt.title('Distribución de Ventas en Enero y Febrero')
plt.xlabel('Ventas')
plt.ylabel('Frecuencia')
plt.legend()
plt.show()






No hay comentarios.:

Publicar un comentario