دمج الباندا - الباندا تعليمي

الباندا دمج() يتم تعريفها على أنها عملية جمع مجموعتي البيانات معًا في مجموعة واحدة ومحاذاة الصفوف بناءً على السمات أو الأعمدة المشتركة. إنها نقطة دخول لجميع عمليات ربط قاعدة البيانات القياسية بين كائنات DataFrame:

بناء الجملة:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

حدود:

DataFrame أو السلسلة المسماة

{'يسار'، 'يمين'، 'خارجي'، 'داخلي'}، افتراضي 'داخلي'

غادر:ويستخدم فقط المفاتيح من الإطار الأيسر، على غرار الصلة الخارجية اليسرى لـ SQL؛ الحفاظ على ترتيب المفاتيح.يمين:يستخدم فقط المفاتيح من الإطار الأيمن، على غرار الصلة الخارجية اليمنى لـ SQL؛ الحفاظ على ترتيب المفاتيح.الخارجي:استخدم اتحاد المفاتيح من كلا الإطارين، على غرار الصلة الخارجية الكاملة لـ SQL؛ فرز المفاتيح معجميا.داخلي:ويستخدم تقاطع المفاتيح من كلا الإطارين، على غرار صلة SQL الداخلية؛ الحفاظ على ترتيب المفاتيح اليسرى.

التسمية أو القائمة

تركت على:

التسمية أو القائمة، أو مثل المصفوفة

منطقي، افتراضي خطأ

مجموعة من (str، str)، الافتراضي ('_x'، '_y')

منطقي، الافتراضي صحيح

منطقي أو str، الافتراضي خطأ

_دمج

'اليسار فقط'للملاحظات التي يظهر مفتاح الدمج الخاص بها فقط في 'يسار' DataFrame، بينما،'اليمين_فقط'يتم تعريفه للملاحظات التي يظهر فيها مفتاح الدمج فقط في 'يمين' DataFrame،'كلاهما'إذا تم العثور على مفتاح دمج الملاحظة في كل منهما.

شارع، اختياري

'one_to_one' أو '1:1': يتحقق مما إذا كانت مفاتيح الدمج فريدة في كل من مجموعات البيانات اليمنى واليسرى.
'one_to_many' أو '1:m': يتحقق مما إذا كانت مفاتيح الدمج فريدة في مجموعة البيانات اليسرى فقط.
'many_to_one' أو 'm:1': يتحقق مما إذا كانت مفاتيح الدمج فريدة في مجموعة البيانات الصحيحة فقط.
'many_to_many' أو 'm:m': مسموح به، ولكنه لا يؤدي إلى عمليات فحص.

مثال 1: دمج إطاري بيانات على مفتاح

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

انتاج |

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

مثال 2: دمج إطاري بيانات على مفاتيح متعددة:

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

انتاج |

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview