top of page
القيم المفقودة في لغة R
Missing Values
ماهي القيم المفقودة في لغة R؟
القيمة المفقودة هي قيمة غير معروفة. يتم تمثيل القيم المفقودة في R بواسطة رمز NA.
NA هي قيمة خاصة تختلف خصائصها عن القيم الأخرى. NA هي واحدة من الكلمات القليلة المحجوزة في R لا يمكنك إعطاء أي شيء بهذا الاسم. (نظرًا لأن R حساس لحالة الأحرف، فلا بأس باستخدام Na و Na، على الرغم من أنني لا نوصي بها).
يمكن أن تنشأ NAs عندما تقرأ في جدول بيانات Excel مع خلايا فارغة، على سبيل المثال. سترى أيضًا NA عند تجربة عمليات معينة غير قانونية أو غير منطقية. فيما يلي مثال على العمليات التي تنتج NA.
أريد أن أكشف عن القيم المفقودة (NA's) !
لا يمكنك العثور على القيم المفقودة بالنظر إلى (x == NA). مثل معظم الدالات الأخرى، لكن يمكنك استخدام الدالة is.na () ستعثر لك على القيم المفقودة حيث تُرجع هذه الدالة متجهًا منطقيًا، T للقيم المفقودة و F للقيم الغير مفقودة. من الشائع إلى حد ما أن ترغب في معرفة فهرس القيم المفقودة, أما في حال أردت معرفة رقم الخانة المفقودة فيمكنك استخدام الدالة (which()) التي ستساعدك في هذه الوظيفة.
في هذا المثال تم استخدام مجموعة بيانات تخص السيارات (اسمها، نوعها، قوة الحصان، الاسطوانات...) تستطيع استخدام نفس الكود ولكن بمجموعة البيانات الخاصة بك.
#import Your data
data <- read.csv("R/auto-mpg.csv")
#Convert into Data frame
datadf <- as.data.frame(data)
#A query about the raw data values
head(datadf)
#Count the number of missing data
sumNA <- sum(is.na(datadf))
paste("The number of missing values is: ", sumNA)
#Check If there is Missing Value
if(sumNA == 0){
#There is No Missing Value
paste("Your dataset is complete!")
} else{
index <- unique (unlist (lapply (datadf, function (x) which (is.na (x)))))
#There is Missing Value
paste("Missing value at index: ")
index
}
للوصول إلى مجموعة البيانات المستخدمة في المثال, قم بالضغط على ملف إكسل الظاهر أمامك:
bottom of page