Een leeg gegevensframe maken R

Een Leeg Gegevensframe Maken R



Het maken van een leeg DataFrame in R kan voordelig zijn als we het later met gegevens willen vullen. In R heeft een leeg DataFrame doorgaans 0 rijen en 0 kolommen. Een leeg DataFrame kan echter soms een DataFrame zijn zonder rijen, maar met reeds gedefinieerde kolommen. We kunnen de functie data.frame() gebruiken om een ​​leeg DataFrame te maken met gespecificeerde kolommen in R. Er zijn verschillende benaderingen voor het maken van een leeg dataframe in R. In dit artikel zullen we de benaderingen onderzoeken voor het maken van een leeg DataFrame in R.

Voorbeeld 1: een leeg dataframe maken in R

De meest basale benadering voor het maken van het lege DataFrame in R is het gebruik van de data.frame() methode.

lege_df < - dataframe ( )
afdrukken ( lege_df )
afm ( lege_df )

In de gegeven code van R maken we een data.frame() functie binnen de empty_df. De functie data.frame() neemt geen argumenten, waardoor een dataframe wordt gemaakt zonder rijen en zonder kolommen. Wanneer we de empty_df afdrukken met de print() functie, krijgen we de uitvoer van het lege DataFrame. Vervolgens geven we de empty_df in de functie dim() door om de afmetingen van het dataframe als een vector met twee waarden te krijgen: respectievelijk het aantal rijen en het aantal kolommen.







Daarom geeft het resultaat eerst het bericht weer dat het DataFrame '0' kolommen en '0' rijen heeft. Bovendien krijgen we een vector van twee nullen omdat het DataFrame nul rijen en nul kolommen heeft.





Voorbeeld 2: een leeg dataframe maken met kolom en rij '0' in R

Een andere manier om het lege DataFrame te maken, is door de functie matrix() te gebruiken en deze vervolgens om te zetten in het DataFrame. Als zodanig zijn zowel de matrix- als DataFrame-functies onderling converteerbaar.





m1 = matrix ( ncol = 0 , nummer = 0 )
m1 = matrix ( ncol = 0 , nummer = 0 )
df =data.frame ( m1 )
afdrukken ( 'Leeg gegevensframe' )
afdrukken ( df )
afdrukken ( 'Dataframe-afmetingen' )
afm ( df )

In de gegeven code van R roepen we eerst de functie matrix() aan in de 'm1' en definiëren vervolgens de matrix() door de parameters 'ncol' en 'nrow' door te geven. De waarde die aan deze parameters wordt toegewezen, is '0'. Daarna gebruiken we de functie data.frame() om de 'm1' om te zetten in het DataFrame. Het resultaat van het geconverteerde DataFrame wordt afgedrukt met behulp van de afdrukfunctie. De dimensies worden ook weergegeven voor het DataFrame met behulp van de functie dim().

De uitvoer vertegenwoordigt dus het bericht van het lege dataframe en de nulvectordimensies voor het DataFrame vanwege een lege matrix.



Voorbeeld 3: een leeg dataframe maken met N kolommen in R

Bovendien kunnen we een leeg DataFrame maken door de naam van de kolom op te geven met de functie c(). Beschouw de volgende code van R:

cols = c ( 'naam' , 'leeftijd' , 'merken' )
df = dataframe ( Matrix ( nrrij = 0 , ncol = lengte ( cols ) ) )
colnamen ( df ) = cols
afdrukken ( df )

We noemen de functie c() in de tekenvector 'cols'. Hier wordt de functie c() gespecificeerd met drie kolomnamen. Daarna maken we een lege matrix met 0 rijen en hetzelfde aantal kolommen als de lengte van de cols-vector binnen de matrix()-functie die wordt aangeroepen binnen de data.frame()-functie.

We geven de 'nrow' met de waarde 0 door om een ​​lege matrix te maken. De “ncol” wordt gespecificeerd met length(cols) om een ​​matrix te creëren met hetzelfde aantal kolommen als de lengte van de “cols” vector. Vervolgens wijzen we de kolomnamen toe aan het dataframe met behulp van de functie 'colnames()' en de vector 'cols'.

Zoals we kunnen zien, is het lege dataframe met drie kolomnamen als volgt:

Voorbeeld 4: een leeg dataframe maken met een lege vector toegewezen aan kolommen in R

Naast eerdere benaderingen kunnen we een leeg DataFrame maken door de lege vectoren voor de kolommen op te geven en de rijen uit te sluiten. Laten we ons concentreren op de volgende R-code om dit te bereiken:

df < - dataframe ( c1 = dubbel ( ) ,
c2 = geheel getal ( ) ,
c3 = factor ( ) ,
c4 = logisch ( ) ,
c5 = teken ( ) ,
stringsAsFactors = ONWAAR )
str ( df )

We declareren eerst de functie data.frame(). Vervolgens definiëren we de verschillende gegevenstypen voor verschillende kolommen erin. Merk op dat we geen argumenten doorgeven aan deze gegevenstypefuncties om de lege kolommen zonder waarden te maken.

Bovendien is de 'stringsAsFactors' ingesteld op FALSE om te voorkomen dat R de karakterkolommen automatisch converteert naar factoren. Vervolgens wordt met de functie str() de structuur van het dataframe 'df' afgedrukt, inclusief de gegevenstypen van elke kolom en het aantal rijen in het dataframe.

De resulterende uitvoer wordt weergegeven onder het lege dataframe met vijf kolommen met verschillende gegevenstypen en geen rijen.

Voorbeeld 5: een leeg dataframe maken van een bestaand dataframe in R

Omgekeerd, als we een bestaande DataFrame hebben, kunnen we deze leegmaken om de lege DataFrame te maken. We geven hiervoor de volgende code in R:

df < - dataframe (
sno =c ( 1 , 2 , 3 , 4 ) ,
namen =c ( 'Alex' , 'Candice' , 'Jimmy' , 'Donker' ) ,
leeftijd =c ( eenentwintig , 24 , 25 , 26 )
)
emp_df = df [ ONWAAR, ]
emp_df

We definiëren het DataFrame dat verschillende kolomnamen met verschillende soorten waarden gebruikt. Het is veelbetekenend dat het dataframe 'df' hier vier rijen met gegevens bevat. Daarna declareren we een nieuw dataframe dat 'emp_df' is met behulp van de logische index, FALSE. Deze index selecteert geen rijen uit de 'df'. Daarom heeft het 'emp_df' DataFrame dezelfde kolomnamen en gegevenstypen als 'df'.

De volgende uitvoer geeft de kolommen, datatypes en het aantal rijen van het dataframe weer. Omdat het dataframe nul rijen heeft, worden de rijen met nulwaarden weergegeven:

Voorbeeld 6: een leeg dataframe maken met behulp van de methode Structure() in R

We kunnen effectief gebruik maken van de methode structure() om een ​​leeg dataframe te genereren. Deze functie geeft details over een bepaald object met specifieke kenmerken. Kijk naar de volgende code van R die een leeg dataframe maakt met behulp van de structuur() functie:

df < - structuur ( lijst ( naam = karakter ( ) ,
locatie = karakter ( ) ,
datum = as.Datum ( karakter ( ) ) ) ,
klasse = 'data.frame' )
str ( df )

We specificeren de namen van de kolommen die de character() en as.Date(character()) bevatten om respectievelijk een leeg teken en datumvectoren te maken. Deze kolommen worden doorgegeven binnen de functie list() die de beginwaarden van de kolommen specificeert. De functie structure() wordt hier gebruikt om het dataframe te maken en toe te wijzen aan de klasse 'data.frame'.

De volgende uitvoer vertegenwoordigt het dataframe met 0 waarnemingen en 3 variabelen en geeft de namen en datatypes van elke variabele:

Conclusie

De functie data.frame() wordt gebruikt om het lege DataFrame te maken in alle gegeven voorbeelden. We gebruikten eerst de functie data.frame() zonder parameters voor een leeg DataFrame. Vervolgens hebben we een leeg DataFrame gemaakt door de rijen en kolommen op te geven met nulwaarden. We specificeerden ook de kolommen met de waarde en rijen met nul, specificeerden alleen de kolommen met waarden en 0 rijen en gebruikten de lege vector. Ten slotte hebben we het lege DataFrame gemaakt met behulp van de structuur() functie.