ازي تكون data science من رأيي
1- Excel
2-SQL
3-python
لازم تكون شاطر جدا في ال programming ف انت في المرحلة دي هتذاكر بايثون وداتا ستراكشر و oop
4-python libraries for analysis
5- power bi
6- statistics
انت كده محلل بيانات رسمي وتقدر تقدم علي وظيفة بس طبعا لازم مشاريع
تابع👇
مجموعه من الكورسات المجانيه في مجال تحليل البيانات
🟤 كورسات Google
جوجل بتقدم فرصه عظيمه جداا جداا
1. Google Advanced Data Analytics Professional Certificate:
2. Google Business Intelligence Professional Certificate:
واحد من اهم المهارات الرياضيه في الماشين ليرنينج هو الجبر الخطي حيث يمكن التعبير عن البيانات في صورة matrix
وايضا يستخدم في
preprocessing, data transformation,
and model evaluation.
ومن تطبيقاته مبدأ ال PCA الذي يقلل ابعاد البيانات ومسح العلاقات بينهم
لو حابب تتعلم بايثون باللغة العربية في كورسين متميزين جدا
الأول من قناة codezilla
عبارة عن اساسيات بايثون
والتاني حرفيا كورس master للبايثون
من قناة ال elzero
error matrix أو confusion_matrix:
هي مصفوفة تستخدم لتقييم أداء نماذج التصنيف، أي نستخدمها عندما تكون المهمة هي مهمة تصنيف Classification.
هذه المصفوفة تقوم بحساب TP و FP و FN و TN
دى لينكات لتدريبات virtual بتحاكى الحقيقة مصصمة من شركات مختلفة فى المجال عشان تدرب على الdata analysis
1️⃣ 𝗞𝗣𝗠𝗚 Data Analytics Internship:
2️⃣ 𝗕𝗖𝗚 Data Science & Analytics:
مصادر تعلم ال data science
في مصادر انا شوفتها غير مجانيه ف أفضل احط المجاني بس عشان تكون متاحة للجميع
Statistics and machine learning
كنت بشوف منهم النظري اما الكود كنت بشوفه من قناة code basic
ك machine learning و deep learning
Engineer
بتنسي حاجات كتير وبتبقي عايز تراجع او مثلا كنت بتحضر ل interview وعايز تشوف الاسأله بتبقي عامله ازي
وهو ده فايده ال cheat cheets
هنا متوفر في الدرايف الأساله
كورسات
By microsoft
عباره عن labs و notebooks
بتشتغل علي مواضيع ال deep learning والتطبيقات معاك خطوه بخطوه وفيها تنظيم
في اخر اللينك هتلاقي لينكات لل
iot
web dev
Data science
Machine learning
الفرق بين ال Bagging و boosting
الbagging بيشتغل بالتوازي محدش بيأثر في التاني وده اللي شغال بيه ال random forest انهم يعملوا majorty vote
الboosting بيكون sequantial بمعني الشجره الاول بتتوقع والتاني بيحاول ميغلطش في الأول غلط فيه ويتعملهم combination في الأخر زي ال xgboost
عشان تعدي مرحلة البدايات وتدخل في مرحلة ال advanced عليك وعلي قراءة الكتب في مجالك
عشان كده ممكن كل أسبوع هنقترح كتاب في مجال الداتا
وأول كتاب معانا هو
Head First Data Analysis📖
ال linear regression هي معادله خطيه درجة الاس للاكس فيها واحد
ال polynomial هي معادله بردك لاكن درجة الاس للاكس اكبر من واحد وده بنلجأ ليها لما نسبة الخطأ في ال linear كبير وده يدل ان المعادله غير خطيه وعايزين نزود ال complex بتاع الموديل بتاعنا عشان نرفع الكفاءة
البوست ده بجد هيفرق معاك كده احتفظ بيه
كتير بيعاني انه يشتغل علي مشاريع حقيقة في مجال ال data science او انه ينزل تدريب عشان يتعامل مع مشاريع حقيقة
عشان كده ال virtual intern بتوفر عليك كتير
الموقع اللي عليه الداتا هو forage موقع كويس جدا
لو الداتا بتاعتك normal distribution او قريبه منها وعايز تعرف مثلا 68 في الميه من الداتا واقعه فين بنستخدم ال empirical rule
عباره عن اننا بنجمع ونطرح من المتوسط ال standard deviation وده هيكون الفتره اللي فيها 68 في الميه من الداتا
نفس الطريقه علي 95 و 99 في الميه من الداتا
أي سؤال في علوم البيانات أو محتاج مساعدة؟ اكتب هنا أو تواصل معي خاص. سأكون سعيداً للمساعدة! 🌟🤖
البوست هيكون أسبوعي ان شاء الله... ولو حد عايز يكلمني واتس اللينك عالصفحة
#DataScience
#MachineLearning
ساعات كتير بتكون الداتا منعرفش نفصلها بطريقه linear عشان كده بتيجي ال kernal بتحل المشكله دي عن طريق اننا بنزود ابعاد فبقينا بنشوف الداتا بزاويه تانيه وهنا ساعتها نقدر نفصلها ب surface
امتي تبدأ تشتغل freelance في مجال الداتا ساينس وال ai؟
انا شايف انك تبدأ ومتستناش انك بقي تنين في المجال لان مش كل التاسكات متقدمة وهتلاقي كتير في مستواك فدور علي الحاجة اللي في مستواك واللي أعلا بشوايه بحيث مع شواية بحث تقدر تعملها
وده هيساعدك جدا وانت بتقدم علي وظيفة
الفرق بين الاحصاء
الوصفي والاستدلالي
الأولي تستخدم في تلخيص البيانات عن طريق بعد من العمليات الحسابيه مثل المتوسط والرسومات البيانيه ايضا ويكون هذا علي ال sample
الثانيه تستخدم في فهم ال الاحصاء الوصفيه ونستخدم الاحتمالات في فحص ان كان هذا يسير ايضا علي ال population
هل ينفع اكون مهندس ماشين ليرنينج بدون رياضيات الأجابة لاا طبعا
طب ايه الرياضيات المطلوبة
Statistics
Linear algebra
calculus
علي الترتيب
هننشر بوست قريب عن اهميه كل واحد فيهم
أفضل 5 كتب ل data science
Practical Statistics for Data Scientists
Head First Statistics: A Brain-Friendly Guide
Python for data analysis
Naked statistics
Hands-On Machine Learning
في مشكلة ساعات بتظهر وانت شغال علي داتا وهي ان ال label اللي معاك بيكون imbalance بمعني ايه؟ بمعني مثلا لو عندك 100 sample والداتا عن مرض السكر مثلا هيكون فيه منهم 95 سليم و 5 مريض فلو جيت تعمل الموديل هتلاقيه بيعمل انحياز
(bias)
للسليم فعلي الأغلب الناتج هيطلع انه مش مريض
كمل👇
نصايح
-عشان تكون مميز في مجال data science
اتعلم ازي تعمل deployment لانه بيزود فرصك لان لو صاحب الشغل شاف product قدامه منك فرصتك هتبقي اكبر وكمان عشان تبقي فاهم البروسيس بتبقي ماشيه ازي
-خلي مشاريع unique متعملش زي
(Titanic)
مثلا لقينا ان كلما زاد معدل بيع الايس كريم زاد معدل الجريمه احنا منعرفش ايه السبب المنطقي بس لقينا ان في r بينهم وده اللي اسمه correlation
اما مثلا كلما زاد الحر زاد بيع الايس كريم وهو ده ال causation لان في سبب منطقي
“correlation does not imply causation“
إليك بعض المواقع التي يمكنك العثور فيها على البيانات لتدريب نموذجك:
1. Kaggle ()
2. UCI Machine Learning Repository ()
3. Google Dataset Search ()
4. ()