تحليل البيانات أصبح عنصرًا أساسيًا لاتخاذ القرارات الذكية في الشركات والمشاريع التجارية. في ظل تزايد حجم البيانات المتاحة، أصبح من الضروري استخدام أدوات تحليل فعالة لاستخراج المعلومات القيمة. باستخدام Python، يمكننا معالجة وتحليل البيانات بسهولة باستخدام مكتبات قوية مثل Pandas، NumPy، Matplotlib، وSeaborn. في هذا المشروع، سنقوم بتطبيق عملي لتحليل بيانات مبيعات متجر إلكتروني باستخدام هذه الأدوات لتقديم رؤى مفيدة حول الأداء المالي للمبيعات، وتوجهات السوق، وأداء العملاء. سيتضمن هذا المشروع أيضًا بعض التحليلات الإحصائية ورسومات بيانية تساعد على تقديم صورة واضحة ودقيقة.
من خلال هذا التحليل، سنتمكن من تحديد الفئات الأكثر مبيعًا، تحليل اتجاهات المبيعات عبر الزمن، تحديد العملاء الأكثر إنفاقًا، وفهم تأثير الخصومات على المبيعات. هذه البيانات توفر معلومات حيوية تساهم في اتخاذ القرارات الاستراتيجية في الشركات الإلكترونية، مثل تخصيص الموارد بشكل أفضل وتحسين الحملات التسويقية، مما يؤدي في النهاية إلى تحسين الأداء العام وزيادة العوائد. من خلال تحليل هذه البيانات، يمكننا أيضًا استشراف الاتجاهات المستقبلية وتوقع المتغيرات التي قد تؤثر على مبيعات الشركة.
سيتيح لنا هذا التحليل فرصة لاستخلاص استنتاجات من بيانات ضخمة معقدة وتحويلها إلى معلومات قابلة للتنفيذ تسهم في تحسين استراتيجيات العمل وتعزيز الكفاءة.
.png)
الكود الكامل للمشروع
import pandas
as pd
import numpy as np
import matplotlib.pyplot
as plt
import seaborn
as sns
df = pd.read_csv("sales_data.csv")
print(df.head())
print(df.info())
print(df.describe())
print(df.isnull().sum())
df = df.dropna()
df.fillna(df.mean(), inplace=True)
sales_by_category = df.groupby("Category")["Sales"].sum()
plt.figure(figsize=(8, 5))
sales_by_category.plot(kind="bar", color=["#FF6F61",
"#6B4226",
"#FFD166"])
plt.title("إجمالي المبيعات حسب الفئة")
plt.xlabel("الفئة")
plt.ylabel("إجمالي المبيعات")
plt.xticks(rotation=45)
plt.show()
df["Order Date"]
= pd.to_datetime(df["Order Date"])
df["Year-Month"]
= df["Order Date"].dt.to_period("M")
monthly_sales = df.groupby("Year-Month")["Sales"].sum()
plt.figure(figsize=(10, 5))
monthly_sales.plot(marker="o", linestyle="-", color="#007ACC")
plt.title("اتجاهات المبيعات الشهرية")
plt.xlabel("التاريخ")
plt.ylabel("إجمالي المبيعات")
plt.grid(True)
plt.show()
top_customers = df.groupby( "Customer Name" )["Sales"].sum().sort_values(ascending=False).head(10)
plt.figure(figsize=(10, 5))
top_customers.plot(kind="barh", color="#28B463")
plt.title("أكثر 10 عملاء إنفاقًا")
plt.xlabel("إجمالي المبيعات")
plt.ylabel("اسم العميل")
plt.gca().invert_yaxis()
plt.show()
plt.figure(figsize=(8, 5))
sns.scatterplot(data=df, x="Discount",
y="Sales",
alpha=0.5, color="#D35400")
plt.title("تأثير الخصومات على المبيعات")
plt.xlabel("الخصم")
plt.ylabel("المبيعات")
plt.show()
شرح الكود بالتفصيل
1️⃣استيراد المكتبات الضرورية: تم استيراد مكتبات Pandas للتعامل مع البيانات، NumPy للعمليات الحسابية، وMatplotlib وSeaborn للرسم البياني وتحليل البيانات بصريًا.
2️⃣تحميل البيانات: قمنا بقراءة ملف CSV باستخدام pd.read_csv وتحويله إلى DataFrame.
3️⃣استكشاف البيانات: استخدمنا ()head لعرض أول 5 صفوف من البيانات و ()info للحصول على معلومات حول الأعمدة وأنواع البيانات. ثم قمنا بعرض الإحصائيات الأساسية باستخدام ()describe.
4️⃣تنظيف البيانات: تم البحث عن القيم الفارغة باستخدام .()isnull().sum وفي حال وجود قيم مفقودة، قمنا بحذفها باستخدام ()dropna أو تعويضها بالقيمة المتوسطة باستخدام ()fillna.
5️⃣تحليل المبيعات حسب الفئات: قمنا بتجميع المبيعات حسب الفئة باستخدام ()groupby وعرضنا النتائج في رسم بياني باستخدام plot(kind="bar").
6️⃣تحليل اتجاهات المبيعات عبر الزمن: حولنا عمود "Order Date" إلى نوع تاريخي باستخدام ()pd.to_datetime واستخرجنا السنة والشهر باستخدام dt.to_period("M"). ثم قمنا بتجميع البيانات شهريًا باستخدام ()groupby ورسمنا المبيعات الشهرية.
7️⃣تحليل العملاء الأكثر إنفاقًا: تم تجميع البيانات حسب العميل وحساب إجمالي المبيعات لكل عميل، وتم عرض أعلى 10 عملاء في رسم بياني أفقي باستخدام plot(kind="barh").
8️⃣تحليل تأثير الخصومات على المبيعات: استخدمنا sns.scatterplot لعرض تأثير الخصومات على المبيعات من خلال رسم مخطط تشتت.
يقدم هذا التطبيق رؤية شاملة حول المبيعات واتجاهاتها، العملاء الأكثر إنفاقًا، وتأثير الخصومات على المبيعات. باستخدام هذه الأدوات المتقدمة والرسومات البيانية التفاعلية، يمكننا فهم البيانات بشكل أكثر دقة واتخاذ قرارات استراتيجية مدروسة لتحسين الأداء التجاري وزيادة الإيرادات. من خلال تحليل هذه البيانات، يمكن للشركات تحديد الفرص المناسبة، مثل زيادة الاستثمارات في فئات معينة أو تحسين استراتيجيات التسويق. لا تتردد في تعديل الكود لتخصيص التحليل حسب احتياجاتك أو تجربة مجموعات بيانات مختلفة.
يمكنك أيضًا توسيع هذا المشروع لإضافة مزيد من التحليلات المتقدمة مثل التنبؤ بالمبيعات باستخدام تقنيات التعلم الآلي أو مقارنة المبيعات مع العوامل الموسمية. استمر في تعلم وتحليل البيانات لتحسين مهاراتك في Python وتوسيع قدرتك على التعامل مع كميات ضخمة من المعلومات. استمتع بتحليل البيانات واكتشاف الأنماط التي تساعدك في اتخاذ قرارات أفضل والاستفادة القصوى من البيانات المتاحة!