logo

سلسلة بايثون الباندا

يمكن تعريف سلسلة Pandas على أنها مصفوفة أحادية البعد قادرة على تخزين أنواع مختلفة من البيانات. يمكننا بسهولة تحويل القائمة والصفوف والقاموس إلى سلسلة باستخدام ' مسلسل ' طريقة. تسميات صف السلسلة تسمى الفهرس. لا يمكن أن تحتوي السلسلة على أعمدة متعددة. لديها المعلمة التالية:

    بيانات:يمكن أن تكون أي قائمة أو قاموس أو قيمة عددية.فِهرِس:يجب أن تكون قيمة الفهرس فريدة وقابلة للتجزئة. ويجب أن تكون بنفس طول البيانات. إذا لم نمرر أي فهرس، فسيتم تعيينه بشكل افتراضي ترتيب np (ن) سوف يستخدم.نوع:يشير إلى نوع البيانات من السلسلة.ينسخ:يتم استخدامه لنسخ البيانات.

إنشاء سلسلة:

يمكننا إنشاء سلسلة بطريقتين:

  1. إنشاء سلسلة فارغة
  2. إنشاء سلسلة باستخدام المدخلات.

إنشاء سلسلة فارغة:

يمكننا بسهولة إنشاء سلسلة فارغة في Pandas مما يعني أنه لن يكون لها أي قيمة.

بناء الجملة المستخدم لإنشاء سلسلة فارغة:

 = pandas.Series() 

يقوم المثال أدناه بإنشاء كائن نوع سلسلة فارغة لا يحتوي على قيم وله نوع بيانات افتراضي، على سبيل المثال، float64 .

مثال

قائمة السهام
 import pandas as pd x = pd.Series() print (x) 

انتاج |

 Series([], dtype: float64) 

إنشاء سلسلة باستخدام المدخلات:

يمكننا إنشاء سلسلة باستخدام مدخلات مختلفة:

  • مجموعة مصفوفة
  • قاموس
  • القيمة العددية

إنشاء سلسلة من المصفوفة:

قبل إنشاء سلسلة، علينا أولاً استيراد ملف numpy الوحدة النمطية ثم استخدم الدالة array() في البرنامج. إذا كانت البيانات ndarray، فيجب أن يكون الفهرس الذي تم تمريره بنفس الطول.

إذا لم نقم بتمرير فهرس، فسيتم بشكل افتراضي فهرس النطاق (ن) يتم تمريره حيث يحدد n طول المصفوفة، أي [0,1,2,.... النطاق (لين (صفيف))-1 ].

الاجتياز الداخلي للشجرة الثنائية

مثال

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

انتاج |

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

إنشاء سلسلة من dict

يمكننا أيضًا إنشاء سلسلة من dict. إذا تم تمرير كائن القاموس كمدخل ولم يتم تحديد الفهرس، فسيتم أخذ مفاتيح القاموس بترتيب فرز لإنشاء الفهرس .

إذا تم تمرير الفهرس، فسيتم استخراج القيم التي تتوافق مع تسمية معينة في الفهرس من الملف قاموس .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

انتاج |

 x 0.0 y 1.0 z 2.0 dtype: float64 

إنشاء سلسلة باستخدام Scalar:

إذا أخذنا القيم العددية، فيجب توفير الفهرس. سيتم تكرار القيمة العددية لمطابقة طول الفهرس.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

انتاج |

 0 4 1 4 2 4 3 4 dtype: int64 

الوصول إلى البيانات من السلسلة ذات الموضع:

بمجرد إنشاء كائن نوع السلسلة، يمكنك الوصول إلى فهارسه وبياناته وحتى عناصره الفردية.

اختصارات لينكس

يمكن الوصول إلى البيانات الموجودة في السلسلة بشكل مشابه لتلك الموجودة في ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

انتاج |

 1 

سمات كائن السلسلة

يتم تعريف سمة السلسلة على أنها أي معلومات تتعلق بكائن السلسلة مثل الحجم ونوع البيانات. إلخ. فيما يلي بعض السمات التي يمكنك استخدامها للحصول على معلومات حول كائن السلسلة:

صفات وصف
Series.index يحدد فهرس السلسلة.
سلسلة. الشكل تقوم بإرجاع صف من شكل البيانات.
سلسلة.dtype تقوم بإرجاع نوع البيانات من البيانات.
حجم السلسلة يقوم بإرجاع حجم البيانات.
سلسلة فارغة يتم إرجاع True إذا كان كائن السلسلة فارغًا، وإلا فسيتم إرجاع خطأ.
سلسلة.حسنان يتم إرجاع True إذا كان هناك أي قيم NaN، وإلا يتم إرجاع false.
سلسلة.nbytes تقوم بإرجاع عدد البايتات في البيانات.
سلسلة أنا تقوم بإرجاع عدد الأبعاد في البيانات.
حجم السلعة تقوم بإرجاع حجم نوع بيانات العنصر.

استرداد مصفوفة الفهرس ومصفوفة البيانات لكائن متسلسلة

يمكننا استرداد مصفوفة الفهرس ومصفوفة البيانات لكائن السلسلة الموجود باستخدام فهرس السمات والقيم.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

انتاج |

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

استرداد الأنواع (dtype) وحجم النوع (itemsize)

يمكنك استخدام السمة dtype مع كائن السلسلة كنوع dtype لاسترداد نوع البيانات لعنصر فردي لكائن سلسلة، ويمكنك استخدام حجم الصنف السمة لإظهار عدد البايتات المخصصة لكل عنصر بيانات.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

انتاج |

سلسلة إلى حرف
 int64 8 float64 8 

استرجاع الشكل

يحدد شكل كائن السلسلة العدد الإجمالي للعناصر بما في ذلك القيم المفقودة أو الفارغة (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

انتاج |

 (4,) (3,) 

استرداد البعد والحجم وعدد البايتات:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

انتاج |

 1 1 4 3 32 24 

التحقق من الفراغ ووجود NaNs

للتحقق من أن كائن السلسلة فارغ، يمكنك استخدام الأمر سمة فارغة . وبالمثل، للتحقق مما إذا كان كائن السلسلة يحتوي على بعض قيم NaN أم لا، يمكنك استخدام التابع حسان يصف.

تحتوي السلسلة

مثال

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

انتاج |

 False False True True False False 4 3 3 3 

وظائف السلسلة

هناك بعض الوظائف المستخدمة في السلسلة وهي كما يلي:

المهام وصف
سلسلة الباندا.خريطة() قم بتعيين القيم من سلسلتين لهما عمود مشترك.
سلسلة الباندا.std() حساب الانحراف المعياري لمجموعة معينة من الأرقام وDataFrame والعمود والصفوف.
سلسلة الباندا.to_frame() تحويل كائن السلسلة إلى إطار البيانات.
سلسلة الباندا.value_counts() إرجاع سلسلة تحتوي على عدد من القيم الفريدة.