Krijg een aantal kolommen in R DataFrame

Krijg Een Aantal Kolommen In R Dataframe



In R is het ophalen van het aantal kolommen een basisbewerking die in veel situaties vereist is bij het werken met DataFrames. Bij het subsetten, analyseren, manipuleren, publiceren en visualiseren van de gegevens is het aantal kolommen een cruciaal stuk informatie om te weten. Daarom biedt R verschillende benaderingen om het totaal van de kolommen van het opgegeven DataFrame te krijgen. In dit artikel bespreken we enkele benaderingen die ons helpen het aantal kolommen van het DataFrame te berekenen.

Voorbeeld 1: de functie Ncol() gebruiken

De ncol() is de meest voorkomende functie om het totaal van de kolommen van de DataFrames te krijgen.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Aantal kolommen in dataframe :', n)

In dit voorbeeld maken we eerst een 'df' DataFrame met drie kolommen die zijn gelabeld als 'y1', 'y2' en 'y3' met behulp van de functie data.frame() in R. De elementen in elke kolom worden gespecificeerd met behulp van de c() functie die een vector van elementen creëert. Vervolgens wordt met behulp van de variabele 'n' de functie ncol() gebruikt om het totaal aantal kolommen in het 'df'-dataframe te bepalen. Ten slotte, met het beschrijvende bericht en de variabele 'n', drukt de meegeleverde functie cat() de resultaten af ​​op de console.



Zoals verwacht geeft de opgehaalde uitvoer aan dat het opgegeven DataFrame drie kolommen heeft:







Voorbeeld 2: Tel het totale aantal kolommen voor het lege dataframe

Vervolgens passen we de functie ncol() toe op het lege DataFrame dat ook de waarden van het totale aantal kolommen ophaalt, maar die waarde is nul.

lege_df <- data.frame()

n <- ncol(lege_df)

cat('---Kolommen in dataframe :', n)

In dit voorbeeld genereren we het lege DataFrame, 'empty_df', door data.frame() aan te roepen zonder kolommen of rijen op te geven. Vervolgens gebruiken we de functie ncol() die wordt gebruikt om het aantal kolommen in het DataFrame te vinden. De functie ncol() wordt hier ingesteld met de 'empty_df' DataFrame om het totale aantal kolommen te krijgen. Aangezien het 'empty_df' DataFrame leeg is, heeft het geen kolommen. De uitvoer van ncol(empty_df) is dus 0. De resultaten worden weergegeven door de cat()-functie die hier wordt gebruikt.



De uitvoer toont de waarde '0' zoals verwacht omdat het DataFrame leeg is.

Voorbeeld 3: de functie Select_If() gebruiken met de functie Length().

Als we het aantal kolommen van een specifiek type willen ophalen, moeten we de functie select_if() gebruiken in combinatie met de functie length() van R. Deze functies worden gebruikt die worden gecombineerd om het totaal van de kolommen van elk type te krijgen . De code om deze functies te gebruiken is als volgt geïmplementeerd:

bibliotheek(dplyr)

x1<-LETTERS[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Zomer','Winter'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

lengte(select_if(df1,is.numeriek))

In dit voorbeeld laden we eerst het dplyr-pakket zodat we toegang hebben tot de functie select_if() en de functie length(). Vervolgens maken we de vier variabelen - respectievelijk 'x1', 'x2', 'x3' en 'x4'. Hier bevat 'x1' de eerste 10 hoofdletters van het Engelse alfabet. De variabelen 'x2' en 'x3' worden gegenereerd met behulp van de functie rpois() om twee afzonderlijke vectoren van 10 willekeurige getallen te maken met respectievelijk parameters 2 en 5. De variabele 'x4' is een factorvector met 10 elementen die willekeurig worden bemonsterd uit vector c ('Zomer', 'Winter').

Vervolgens proberen we het 'df1' DataFrame te maken waar alle variabelen worden doorgegeven in de data.frame() functie. Ten slotte roepen we de functie length() aan om de lengte te bepalen van het 'df1'-dataframe dat is gemaakt met behulp van de functie select_if() uit het dplyr-pakket. De select_if() functie selecteert de kolommen van een 'df1' DataFrame als een argument en de is.numeric() functie selecteert alleen de kolommen die numerieke waarden bevatten. Vervolgens haalt de functie length() het totaal aantal kolommen op dat is geselecteerd door select_if(), wat de uitvoer is van de volledige code.

De lengte van de kolom wordt weergegeven in de volgende uitvoer die het totale aantal kolommen van het DataFrame aangeeft:

Voorbeeld 4: de functie Sapply() gebruiken

Omgekeerd, als we alleen de ontbrekende waarden van de kolommen willen tellen, hebben we de sapply() functie. De functie sapply() herhaalt elke kolom van het DataFrame om specifiek te werken. De functie sapply() wordt eerst doorgegeven met het DataFrame als argument. Vervolgens moet de bewerking op dat DataFrame worden uitgevoerd. De implementatie van de functie sapply() om het aantal NA-waarden in de DataFrame-kolommen op te halen, is als volgt:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(nieuwe_df, functie(x) som(is.na(x)))

In dit voorbeeld genereren we het 'new_df' DataFrame met drie kolommen - 'c1', 'c2' en 'c3'. De eerste kolommen, 'c1' en 'c3', bevatten de numerieke waarden inclusief enkele ontbrekende waarden die worden weergegeven door NA. De tweede kolom, 'c2', bevat de tekens inclusief enkele ontbrekende waarden die ook worden weergegeven door NA. Vervolgens passen we de functie sapply() toe op het dataframe 'new_df' en berekenen we het aantal ontbrekende waarden in elke kolom met behulp van de uitdrukking sum() in de functie sapply().

De functie is.na() is die uitdrukking die is opgegeven voor de functie sum() die een logische vector retourneert die aangeeft of elk element in de kolom ontbreekt of niet. De functie sum() telt de TRUE-waarden op om het aantal ontbrekende waarden in elke kolom te tellen.

Daarom geeft de uitvoer de totale NA-waarden weer in elk van de kolommen:

Voorbeeld 5: de functie Dim() gebruiken

Bovendien willen we het totale aantal kolommen samen met de rijen van het DataFrame krijgen. Vervolgens levert de functie dim() de afmetingen van het DataFrame. De functie dim() neemt het object als argument waarvan we de afmetingen willen ophalen. Hier is de code om de functie dim() te gebruiken:

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

punten=c(8, 10, 7, 4))

zwak(d1)

In dit voorbeeld definiëren we eerst het 'd1' DataFrame dat wordt gegenereerd met de functie data.frame() waarbij twee kolommen zijn ingesteld op 'team' en 'punten'. Daarna roepen we de functie dim() aan via het 'd1' DataFrame. De functie dim() retourneert het aantal rijen en kolommen van het DataFrame. Daarom, wanneer we de dim(d1) uitvoeren, retourneert het een vector met twee elementen - waarvan de eerste het aantal rijen in het 'd1' DataFrame weerspiegelt en de tweede het aantal kolommen vertegenwoordigt.

De uitvoer vertegenwoordigt de afmetingen van het DataFrame waarbij de waarde '4' het totale aantal kolommen aangeeft en de waarde '2' de rijen vertegenwoordigt:

Conclusie

We hebben nu geleerd dat het tellen van het aantal kolommen in R een eenvoudige en belangrijke bewerking is die kan worden uitgevoerd op het DataFrame. Van alle functies is de functie ncol() de handigste manier. Nu zijn we bekend met de verschillende manieren om het aantal kolommen uit het gegeven DataFrame te halen.