Voeg Dict toe aan DataFrame in Panda's

Voeg Dict Toe Aan Dataframe In Panda S



We zullen met voorbeelden bespreken hoe u een woordenboek aan het bestaande Pandas DataFrame kunt toevoegen met behulp van de functies pandas.DataFrame.append() en pandas.concat(). Hier verwijst het woordenboek naar het sleutel:waarde-paar, zodat de sleutel verwijst naar de bestaande kolomlabels die aanwezig zijn in het DataFrame en de waarden in een rij worden toegevoegd. We zullen ook de voorbeelden zien die meerdere woordenboeken aan het Pandas DataFrame toevoegen.

Gebruik Pandas.DataFrame.Append

De functie pandas.DataFrame.append() wordt gebruikt om de rijen van een ander DataFrame aan het bestaande DataFrame toe te voegen. Als de kolommen in het bestaande DataFrame niet bestaan, worden de andere DataFrame-kolommen gemaakt in het bestaande DataFrame. Gebruik deze functie zo dat de rij in het DataFrame moet worden ingevoegd door het woordenboek toe te voegen.

Syntaxis :







Het volgende is de daadwerkelijke syntaxis van de pandas.DataFrame.append() functie:



panda's. Gegevensframe . toevoegen ( ander , negeer_index , verifieer_integriteit , soort )
  1. ander : Dit verwijst naar een ander DataFrame waarin de rijen van dit DataFrame worden toegevoegd aan het bestaande DataFrame. Als u één enkele rij wilt toevoegen, moet u een woordenboek met waarden als parameter doorgeven.
  2. negeer_index (standaard = False): deze parameter wordt gebruikt wanneer u rijen toevoegt aan het dataframe dat al rijen bevat. Als het 'False' is, worden de bestaande rij-indexen ook toegevoegd. Als het 'Waar' is, worden de rijen gelabeld van 0 tot n-1. Zorg ervoor dat deze parameter is ingesteld op 'True' terwijl u een woordenboek aan het DataFrame toevoegt. Anders wordt er een fouttype gegenereerd – “TypeError: kan alleen een dictaat toevoegen als negeer_index=True”.
  3. We kunnen controleren op dubbele indexen met behulp van de parameter verificatie_integrity (standaard = False). Als de indices duplicaat zijn en de verificatie_integrity is ingesteld op “True”, retourneert deze de “ValueError: Indexen hebben overlappende waarden”.
  4. Het is mogelijk om de kolommen te sorteren als de kolommen van het bestaande DataFrame en een ander DataFrame niet zijn uitgelijnd met behulp van de sort-parameter door deze in te stellen op “True” (standaard = False).

Voorbeeld 1: Voeg één woordenboek toe

Maak een Pandas DataFrame met vier kolommen – “Campaign_Name”, “Location”, “StartDate” en “Budget” – en drie rijen. Voeg een woordenboek toe aan dit DataFrame.



importeren panda's

# Maak een dataframe - Campagne met 4 kolommen en 3 rijen
Campagne = panda's. Gegevensframe ( [ [ 'Marketingkamp' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Verkoopkamp' , 'Italië' , '25/01/2022' , 10000 ] ,
[ 'Ander kamp' , 'VERENIGDE STATEN VAN AMERIKA' , '17-04-2023' , 2000 ] ] ,
kolommen = [ 'Campagne naam' , 'Plaats' , 'Begin datum' , 'Begroting' ] )
afdrukken ( Campagne , ' \N ' )

# Toevoegen Enkele rij
Campagne = Campagne. toevoegen ( { 'Campagne naam' : 'Technisch kamp' , 'Plaats' : 'VERENIGDE STATEN VAN AMERIKA' , 'Begin datum' : '05/12/2023' , 'Begroting' : 2000 } , negeer_index = WAAR )
afdrukken ( Campagne , ' \N ' )

Uitvoer :





We kunnen zien dat het woordenboek is toegevoegd aan het dataframe 'Campagne'. De index van deze nieuwe rij is 3, aangezien de index wordt genegeerd.



Voorbeeld 2: Meerdere woordenboeken toevoegen

Gebruik hetzelfde DataFrame dat is gemaakt onder Voorbeeld 1 en voeg drie rijen tegelijk toe met de functie pandas.DataFrame.append(). Stel de parameter 'negeer_index' in op 'True'.

importeren panda's

# Maak een dataframe - Campagne met 4 kolommen en 3 rijen
Campagne = panda's. Gegevensframe ( [ [ 'Marketingkamp' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Verkoopkamp' , 'Italië' , '25/01/2022' , 10000 ] ,
[ 'Ander kamp' , 'VERENIGDE STATEN VAN AMERIKA' , '17-04-2023' , 2000 ] ] ,
kolommen = [ 'Campagne naam' , 'Plaats' , 'Begin datum' , 'Begroting' ] )
afdrukken ( Campagne , ' \N ' )

Campagne = Campagne. toevoegen ( { 'Campagne naam' : 'Technisch kamp' , 'Plaats' : 'VERENIGDE STATEN VAN AMERIKA' , 'Begin datum' : '05/12/2023' , 'Begroting' : 2000 } , negeer_index = WAAR )
Campagne = Campagne. toevoegen ( { 'Campagne naam' : 'Marketingkamp' , 'Plaats' : 'India' , 'Begin datum' : '23-06-2023' , 'Begroting' : 9000 } , negeer_index = WAAR )
Campagne = Campagne. toevoegen ( { 'Campagne naam' : 'MSaleskamp' , 'Plaats' : 'Italië' , 'Begin datum' : '24/01/2023' , 'Begroting' : 1200 } , negeer_index = WAAR )
afdrukken ( Campagne )

Uitvoer :

Drie rijen worden achter elkaar toegevoegd met 3, 4 en 5 indices aan het bestaande DataFrame.

Gebruik Pandas.Concat

De functie pandas.concat() voegt twee of meer DataFrames aan elkaar langs de rijen of kolommen. We moeten dus het woordenboek naar het DataFrame transformeren en twee DataFrames aan deze functie doorgeven.

Syntaxis :

Voeg een woordenboek toe aan het bestaande DataFrame:

panda's. concat ( [ Bestaand_DataFrame , Getransformeerd_woordenboek ] , as = 0 , negeer_index , verifieer_integriteit )
  1. Als as = 0, wordt de aaneenschakeling langs de rijen uitgevoerd. De aaneenschakeling gebeurt langs de kolommen als deze is ingesteld. Het noodzakelijke hoofdlettergebruik is toegepast, aangezien dit een subkop is. Noodzakelijk artikel toegevoegd voor beknoptheid.to 1.
  2. De negeer_index (standaard = False): deze parameter wordt gebruikt wanneer u de rijen toevoegt aan het dataframe dat al rijen bevat. Als het 'False' is, worden de bestaande rij-indexen ook toegevoegd. Als het 'Waar' is, worden de rijen gelabeld van 0 tot n-1.
  3. We kunnen controleren op dubbele indexen met behulp van de parameter verificatie_integrity (standaard = False). Als de indices duplicaat zijn en de verificatie_integrity is ingesteld op “True”, retourneert deze de “ValueError: Indexen hebben overlappende waarden”.

Voorbeeld 1: Voeg één woordenboek toe

Maak een Pandas DataFrame met vier kolommen – “Campaign_Name”, “Location”, “StartDate” en “Budget” – en drie rijen. Voeg met behulp van de functie pandas.concat() één woordenboek (DataFrame) als rij toe aan dit DataFrame.

importeren panda's


# Maak een dataframe - Campagne met 4 kolommen en 3 rijen
Campagne = panda's. Gegevensframe ( [ [ 'Marketingkamp' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Verkoopkamp' , 'Italië' , '25/01/2022' , 10000 ] ,
[ 'Ander kamp' , 'VERENIGDE STATEN VAN AMERIKA' , '17-04-2023' , 2000 ] ] ,
kolommen = [ 'Campagne naam' , 'Plaats' , 'Begin datum' , 'Begroting' ] )
afdrukken ( Campagne , ' \N ' )

woordenboek_van_DataFrame = panda's. Gegevensframe ( [ { 'Campagne naam' : 'Servicekamp' , 'Plaats' : 'VERENIGDE STATEN VAN AMERIKA' , 'Begin datum' : '17-04-2023' , 'Begroting' : 1000 } ] )

# Toevoegen Enkele rij
Campagne = panda's. concat ( [ Campagne , woordenboek_van_DataFrame ] , as = 0 )
afdrukken ( Campagne , ' \N ' )

Uitvoer :

We kunnen zien dat het woordenboek is toegevoegd aan het dataframe 'Campagne'. De index van deze nieuwe rij is 0, aangezien de index niet wordt genegeerd.

Voorbeeld 2: Meerdere woordenboeken toevoegen

Gebruik het vorige DataFrame en voeg drie woordenboeken (DataFrame) toe door de index te negeren.

importeren panda's


# Maak een dataframe - Campagne met 4 kolommen en 3 rijen
Campagne = panda's. Gegevensframe ( [ [ 'Marketingkamp' , 'India' , '01/12/2023' , 8000 ] ,
[ 'Verkoopkamp' , 'Italië' , '25/01/2022' , 10000 ] ,
[ 'Ander kamp' , 'VERENIGDE STATEN VAN AMERIKA' , '17-04-2023' , 2000 ] ] ,
kolommen = [ 'Campagne naam' , 'Plaats' , 'Begin datum' , 'Begroting' ] )
afdrukken ( Campagne , ' \N ' )

woordenboek_van_DataFrame = panda's. Gegevensframe ( [ { 'Campagne naam' : 'Techkamp' , 'Plaats' : 'VERENIGDE STATEN VAN AMERIKA' , 'Begin datum' : '17-05-2023' , 'Begroting' : 1000 } ,
{ 'Campagne naam' : 'Maatschappelijke dienstverlening' , 'Plaats' : 'Japan' , 'Begin datum' : '17-04-2023' , 'Begroting' : 200 } ,
{ 'Campagne naam' : 'Verkoopkamp' , 'Plaats' : 'VERENIGDE STATEN VAN AMERIKA' , 'Begin datum' : '18-04-2023' , 'Begroting' : 500 } ] )

# Voeg meerdere rijen toe
Campagne = panda's. concat ( [ Campagne , woordenboek_van_DataFrame ] , as = 0 , negeer_index = WAAR )
afdrukken ( Campagne , ' \N ' )

Uitvoer :

We kunnen zien dat er drie woordenboeken zijn toegevoegd aan het ‘Campagne’-dataframe. De indices van deze woordenboeken zijn 3, 4 en 5, aangezien de parameter negeer_index is ingesteld op 'False'.

Conclusie

De enkele/meerdere woordenboeken worden aan het DataFrame toegevoegd met behulp van de functies pandas.DataFrame.append() en pandas.concat(). De indices van de nieuwe rijen kunnen uniek zijn door de parameter negeer_index in te stellen op “True” in de functie pandas.concat(). Terwijl u de functie pandas.DataFrame.append() gebruikt, stelt u de parameter negeer_index in op 'True'. Anders wordt TypeError gegenereerd.