الجملة التي تتفق مع البيانات الممثلة بالأعمدة

الجملة التي تتفق مع البيانات الممثلة بالأعمدة
الأجابة هي: قرأ مروان عددا من الكتب مساو لما قرأه شادي وانس معا.

هل تحاول فهم مجموعة من البيانات؟ هل تحتاج إلى مساعدة في فهم ما تعنيه الأرقام؟ إذا كان الأمر كذلك، فهذه المدونة لك! سنساعدك في فهم الجمل التي تتوافق مع البيانات التي تمثلها الأعمدة. من خلال دليلنا السهل المتابعة، ستتمكن من تفسير بياناتك والتعلم منها في لمح البصر!

فهم الأعمدة في جملة

الأعمدة في الجملة مهمة لفهم البيانات التي يمثلها الجدول. يمثل كل عمود في الجدول معلومة مختلفة، ومن المهم فهم العمود الذي يمثل أي جزء من المعلومات. على سبيل المثال، يمثل عمود المدينة في الجدول موقع الطالب، ويمثل عمود الدولة البلد الأصلي للطالب. من خلال فهم العمود الذي يتوافق مع أي جزء من المعلومات، من السهل فهم البيانات التي يمثلها الجدول.

باستخدام Regex و SpaCy و NLTK و Python’s Split

يمكن تقسيم الجمل بسهولة إلى كلمات فردية بمساعدة regex و spaCy ومكتبة NLTK. علاوة على ذلك، يمكن تمييز كل كلمة بفئتها الخاصة باستخدام nltk. أخيرًا، يمكنك استخدام scikit-Learn لإجراء بعض التحليلات الإحصائية الأساسية على البيانات. في منشور المدونة هذا، ستتعلم كيفية استخدام هذه الأدوات المتنوعة لفهم بنية الجملة في النص.

الخطوة الأولى هي تقسيم النص إلى جمل فردية باستخدام sent_tokenize (). تأخذ هذه الوظيفة فقرة أو مستندًا كمدخلات وتقوم بإرجاع قائمة بالجمل. يُظهر الإخراج في المحطة أدناه نتائج تقسيم فقرة تحتوي على 10 جمل إلى جمل فردية.

! pip3 تثبيت ufal.

udpipe spacy nltk scikit-learn == 0.

24.
2! pip3 التثبيت الذي يقسم النص إلى جمل (باستخدام nltk.

sent_tokenize) – راجع المربع الخاص بـ

ستستخدم أيضًا regex لمطابقة أجزاء مختلفة من الكلام في بياناتك. على سبيل المثال، يمكنك استخدام regex
! pip3 قم بتثبيت regex لمطابقة الأفعال الموجودة في بياناتك. بمجرد مطابقة جميع الأفعال، يمكنك استخدام spaCy لتحويل الأفعال إلى أسماء وصفات، ثم تخزين النتائج في متجه. يمكنك أيضًا استخدام regex لمطابقة أجزاء أخرى من الكلام مثل الأسماء والصفات.

! pip3 تثبيت regex
Regex لمطابقة الأفعال في بياناتك.
بمجرد مطابقة جميع الأفعال، يمكنك استخدام spaCy لتحويل الأفعال إلى أسماء وصفات، ثم تخزين النتائج في متجه. يمكنك أيضًا استخدام regex لمطابقة أجزاء أخرى من الكلام مثل الأسماء والصفات.

يمكنك استخدام regex لمطابقة أجزاء مختلفة من الكلام مثل الفعل
! pip3 تثبيت regex لمطابقة الأفعال

فجر البيانات في جملة واحدة في كل صف

عند تحليل البيانات، من المهم فهم كيفية استخدام الجداول والصفوف والأعمدة لتمثيل المعلومات. تُستخدم الجداول لتنظيم البيانات في تنسيق يمكن إدارته، وتُستخدم الصفوف لتجميع العناصر المتشابهة. تُستخدم الأعمدة لتمثيل الخصائص المختلفة للبيانات في جدول. على سبيل المثال، قد يمثل العمود الأول في الجدول فئة، وقد يمثل العمود الثاني نسبة أو تكرار أو مقدار هذه الفئة. بالإضافة إلى ذلك، يمكن استخدام الأعمدة لوصف خصائص البيانات في الجدول. على سبيل المثال، قد يحتوي العمود المسمى “الجمل” على قائمة من الجمل التي تتوافق مع البيانات الموجودة في الجدول.

ترميز الجملة باستخدام تقسيم regex و spaCy و nltk و Python.
استخدم انفجار الباندا لتحويل البيانات إلى جملة واحدة في كل صف.

في المثال أدناه، قمت بإنشاء دالة تستخرج جملة واحدة.

كيف يمكنني التوسيع لتشمل المزيد من الجمل؟

الأفعال المفردة للجمل والبنود

باستخدام Regex و SpaCy و NLTK و Python’s Split، يمكننا تقسيم الجملة إلى الأجزاء المكونة لها. على سبيل المثال، في الجملة “John هو أطول من Bill”، كلمة “John” فعل وكلمة “is” هي أداة ربط. معًا، يصنعون جملة بسيطة – فعل واحد. بالإضافة إلى ذلك، فإن الكلمتين “أطول من” هما فعلان – أحدهما لجون والآخر لبيل. كلاهما جمل بسيط لأن كلاهما لهما فعل واحد فقط.

في الجمل الأكثر تعقيدًا، قد يكون هناك أكثر من فعل واحد. على سبيل المثال، في الجملة “يوحنا يكتب ورقة،” الفعل “هو” أداة ربط والفعل “كتابة” هو فعل. معًا، يصنعون جملة مركبة – فعلان.

قد تكون هناك أيضًا كلمات أخرى في الجملة ليست أفعالًا. على سبيل المثال، في الجملة “John has a pencil”، كلمة “has” هي فعل. ومع ذلك، فإن كلمة “قلم رصاص” ليست فعلًا – إنها مجرد كلمة. إنه ليس جزءًا من بنية الجملة.

دعنا نلقي نظرة على مثال عن كيفية استخدام regex لكسر جملة.

يمكن استخدام Regex لتحديد الأنماط في النص. في هذا المثال، سنستخدم regex لكسر الجملة “John أطول من Bill”. سنستخدم الحرف ^ لمطابقة بداية السلسلة، والحرف $ لمطابقة نهاية السلسلة. سيتم تجاهل النص الموجود بين هذين الحرفين (سيتم التعامل معه كمسافة بيضاء).

يمكن أيضًا استخدام Regex لتحديد مجموعات الأحرف. على سبيل المثال، توجد مجموعتان من الأحرف في هذه الجملة: “John” و “Bill”. يمكننا استخدام الأقواس لمطابقة مجموعات الأحرف هذه، والحرف للإشارة إلى أننا نريد مطابقة مثيل واحد لكل مجموعة أحرف.

فهم الجداول والصفوف والأعمدة

الجداول هي أبسط طريقة لتمثيل البيانات. يقوم الجدول بتجميع جميع البيانات في أعمدة وصفوف بحيث يمكن تفسيرها بسهولة. تعد الجداول مفيدة بشكل خاص عندما تحتاج إلى مقارنة البيانات من مصادر مختلفة. على سبيل المثال، يمكنك استخدام جدول لتخزين معلومات حول جنس الطلاب ودرجاتهم.

تمثل الصفوف والأعمدة في الجدول جوانب مختلفة من البيانات. تمثل الصفوف الطلاب، وتمثل الأعمدة سمات هؤلاء الطلاب، مثل جنسهم ودرجاتهم. يتم دائمًا تسمية العمود الأول في الجدول “العنوان”، ويتم تصنيف الأعمدة المتبقية وفقًا للبيانات التي تحتوي عليها.

يعد فهم الجداول والصفوف والأعمدة أمرًا ضروريًا لاستخدام Excel بشكل فعال. تسهل الجداول مقارنة البيانات من مصادر مختلفة، كما أن فهم كيفية عملها سيجعل العمل مع Excel أسهل بكثير.

تعليمات النحو لأجزاء من الكلام

في هذا القسم، سوف نقدم تعليمات القواعد النحوية لأجزاء الكلام. سنبدأ بشرح أساسيات بنية الجملة ثم ننتقل إلى الجداول والصفوف والأعمدة. بعد ذلك، سنناقش أفعالًا وجملًا منفردة. أخيرًا، سنقدم إرشادات للرسوم البيانية والترددات التراكمية.

تتكون الجمل من فعل أو أكثر واسم واحد أو أكثر. تشير الأفعال عادة إلى الفعل الذي يحدث في الجملة، بينما الأسماء هي الكلمات الفعلية التي يتم التحدث بها أو كتابتها. من أجل جعل الجملة نحوية، يجب أن تكون جميع الأفعال في الزمن الصحيح (الماضي أو الحاضر أو ​​المستقبل)، ويجب أن تكون جميع الأسماء في الشكل الصحيح (اسم أو ضمير). بالإضافة إلى ذلك، يجب أن تتفق الأفعال مع رعاياها (الأسماء التي يتصرفون عليها)، ويجب وضع الأسماء في الموضع الصحيح داخل الجملة (قبل أو بعد الفعل، اعتمادًا على دورهم في الجملة).

الجداول هي بنية أساسية في قواعد اللغة الإنجليزية. يتكون الجدول من عمودين أو أكثر ويحتوي على معلومات حول أجزاء الكلام وعدد مرات حدوث كل جزء من الكلام وجنس كل كلمة. على سبيل المثال، يوضح الجدول أدناه عدد المرات التي يظهر فيها كل جزء من الكلام في عينة جملة وجنس كل كلمة.

العمود 1:

جزء من الكلام

عدد مرات المشاهدة

جنس تذكير أو تأنيث

العمود 2:

جنس تذكير أو تأنيث

عدد مرات المشاهدة

جزء من الكلام

بالإضافة إلى الجداول، تحتوي الجمل أيضًا على صفوف. الصف في الجدول عبارة عن مجموعة من البيانات التي تتوافق مع جزء معين من الكلام. على سبيل المثال، في الجدول أعلاه، هناك ثلاثة صفوف تتوافق مع الأجزاء الثلاثة للكلام: الفعل، والاسم، والضمير. يحتوي كل صف على عدد المرات التي يحدث فيها جزء معين من الكلام بالإضافة إلى جنس تلك الكلمة. الجدول أدناه

الفرق بين الرسوم البيانية والرسوم البيانية

الرسوم البيانية والرسوم البيانية هي أدوات مختلفة لتمثيل البيانات. الرسوم البيانية هي في الأساس تمثيل رقمي للبيانات، بينما تستخدم الرسوم البيانية لتصور العلاقات بين المتغيرات. على سبيل المثال، قد يُظهر الرسم البياني العلاقة بين عدد الطلاب الذين حصلوا على درجة معينة في اختبار وعدد الساعات التي قضوها في الدراسة لهذا الاختبار.

يمكن أن تكون الرسوم البيانية مفيدة جدًا لفهم البيانات، لأنها تجعل من السهل معرفة كيفية ارتباط المتغيرات المختلفة. بالإضافة إلى ذلك، يمكن استخدام الرسوم البيانية لمقارنة مجموعات البيانات المختلفة أو لعمل تصورات لهياكل البيانات المعقدة.

أحد الاختلافات المهمة بين الرسوم البيانية والرسوم البيانية هو أن الرسوم البيانية تظهر دائمًا توزيعًا تكراريًا تراكميًا. هذا يعني أن كل شريط في الرسم البياني يمثل العدد الإجمالي لمرات ظهور متغير معين في مجموعة البيانات. على سبيل المثال، في الرسم البياني أعلاه، يمكننا أن نرى أنه تم التصويت على Reyes لأكثر من ضعف مرات التصويت لأي مرشح آخر.

تعتبر الرسوم البيانية رائعة لتصور البيانات، لكنها ليست ضرورية دائمًا. على سبيل المثال، يمكن أيضًا تمثيل الرسم البياني أعلاه بواسطة جدول. في الواقع، يتم إنشاء معظم الرسوم البيانية في Excel باستخدام الجداول.

بشكل عام، تعد الرسوم البيانية أداة قوية لفهم البيانات، ويجب استخدامها كلما أمكن ذلك. ومع ذلك، تعد الجداول مفيدة أيضًا في تمثيل البيانات، ولا يجب تجاهلها مطلقًا.

فهم الترددات التراكمية في المخططات الشريطية

عند تحليل المخططات الشريطية، من المهم فهم كيفية عمل الترددات التراكمية. الترددات التراكمية هي مجموع الترددات الجارية في جدول. هذا يعني أنه عند إضافة البيانات إلى الجدول، سيزداد تكرار هذا العمود بمقدار 1. على سبيل المثال، في الجدول أدناه، يبلغ معدل تكرار العمود المسمى “السيارة” 4. وهذا يعني أن تكرار ” سيتم زيادة “Car” من 3 (تردد “Car” عند إدخال البيانات الواردة في الجدول لأول مرة) إلى 4 (تم إضافة التردد لـ “Car” بعد إجمالي الترددات الجارية لـ “Car”).

يعد التكرار التراكمي مهمًا عند النظر إلى المخططات الشريطية لأنه يسمح لك بمعرفة عدد مرات تمثيل فئة معينة من البيانات. على سبيل المثال، في المخطط الشريطي أدناه، يمكنك أن ترى أن “Car” ممثلة ثلاث مرات (بتكرار 3)، ولكن “Truck” ممثلة مرة واحدة فقط (بتكرار 1). هذا يجعل من السهل معرفة الفئة الأكثر شيوعًا.

فحص البيانات للعناصر المماثلة

عند مراجعة البيانات، من المهم التحقق من وجود عناصر مماثلة. يمكن القيام بذلك من خلال النظر إلى الأعمدة في جدول البيانات ومقارنتها لمعرفة ما إذا كانت متطابقة. إذا فعلوا ذلك، فقد يكون من المفيد اعتبار البيانات كمجموعة سكانية. إذا لم تتطابق الأعمدة، فيمكن اعتبار البيانات كعينة ويجب تحليلها وفقًا لذلك.

تحليل البيانات التي تمثل الإنشاءات المختلفة

يمكن تحليل التركيبات المختلفة للبيانات في هذه الفقرة. على سبيل المثال، يمكن تحليل البيانات الموجودة في العمود الأول باستخدام عوامل التشغيل المنطقية (AND، OR، NOT) لإنشاء عبارات بسيطة. يمكن تقسيم البيانات الموجودة في العمود الثاني إلى أفعال وأسماء فردية لفهم كيفية استخدامها في الجملة. يمكن تحليل البيانات الموجودة في العمود الثالث باستخدام جدول لفهم العناصر المختلفة التي يتم تمثيلها. يمكن تحليل العمود الرابع باستخدام مخطط شريطي لمعرفة كيفية تمثيل الترددات التراكمية. أخيرًا، يمكن تحليل العمود الخامس لمعرفة ما إذا تم تمثيل عناصر مماثلة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

© 2024 مدونة صدى الامة. جميع الحقوق محفوظة. | تم التصميم بواسطة A-Plan Agency