Panda's Som Kolom

Panda S Som Kolom



“Dit artikel laat zien hoe je alle of bepaalde kolommen in een Pandas DataFrame optelt met Python. De functie DataFrame.sum() zal samen met enkele nuttige parameters worden gebruikt in de talrijke voorbeelden van deze tutorial.”

Wanneer deze tutorial voorbij is, weet je misschien hoe je:







    • Vind de som van de dataframekolom in Panda's.
    • De dataframe-kolommen samen toevoegen
    • Voeg kolommen toe aan een Pandas-dataframe die voldoen aan de opgegeven voorwaarde.
    • Bepaal de som na het groeperen van de gegevens van het dataframe.

Hoe de som van dataframe-kolommen bepalen?

De functie 'dataframe.sum()' in Panda's retourneert de totale som voor de opgegeven as. Als de invoer een as van de index is, voegt de functie de waarden van elke kolom afzonderlijk toe en doet vervolgens hetzelfde voor elke kolom, waarbij een reeks wordt geretourneerd die de som van de gegevens/waarden in elke kolom opslaat. Bovendien ondersteunt het het berekenen van de som van het dataframe door de ontbrekende waarden te negeren.



Syntaxis: DataFrame.sum(axis = None, skipna = None, level = None, numeric_only = None, min_count = 0, **kwargs)



Waar,





as: {kolommen (1), index (0)}

bestellen: Negeer NA/null-waarden bij het berekenen van het resultaat.



niveau: Als de opgegeven as hiërarchisch is (een multi-index), tel dan tot een bepaald indexniveau voordat u converteert naar een reeks.

numeriek_alleen: Gewoon float-, int- en booleaanse kolommen zijn acceptabel. Als Geen, probeer dan alles te gebruiken; zo niet, alleen numerieke gegevens. Voor serie, niet geïmplementeerd.

min_count: Het aantal mogelijke waarden dat nodig is om de bewerking te voltooien. De uitkomst is NA als er minder niet-NA-waarden aanwezig zijn dan min_count.

Geeft terug: DataFrame (indien niveau gespecificeerd) of Series.

Voorbeeld # 01: Bepaal de som van een dataframekolom en alle kolommen

We hebben eerst een dataframe nodig met de geldige datatypes, d.w.z. int, float, etc., kolom of kolommen waarvoor we de som van de gegevens kunnen vinden. Het dataframe wordt gemaakt met behulp van de functie pd.DataFrame().


We hebben het vereiste dataframe gemaakt van een python-woordenboek in de functie pd.DataFrame(). In het hierboven gemaakte dataframe zijn er vier kolommen 'Naam', 'dag1', 'dag2' en 'dag3'. Van de vier kolommen zijn de drie kolommen, namelijk 'dag1', 'dag2' en 'dag3', numerieke kolommen met de gegevenswaarden (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, respectievelijk 5, 2, 3, 4, 6, 2) en (7, 4, 3, 5, 6, 2, 1, 4). We kunnen alleen de som voor deze drie kolommen vinden. De som voor zowel reeksen (d.w.z. een kolom) als een volledig dataframe kan worden bepaald met behulp van de methode sum(). Laten we beginnen met te leren hoe u alle gegevens in een Panda's-kolom kunt optellen.


Om de som te bepalen, hebben we de methode sum() gebruikt in de kolom 'dag2'. De functie heeft de somwaarde van 28 geretourneerd. Op dezelfde manier kunnen we de som van elke Dataframe-kolom bepalen. Door simpelweg de methode sum() over het hele dataframe te gebruiken, wordt dit bereikt.


Zoals te zien is, is de som van kolom 'dag1' 31; voor 'dag2' is de somwaarde 28, terwijl voor kolom 'dag3' de somwaarde 32 is.

Voorbeeld # 02: De functie sum() gebruiken om de kolomwaarden van het dataframe samen op te tellen

Zoals u kunt zien aan de uitvoer van het vorige voorbeeld, heeft de functie niet de feitelijke gegevensframekolomgegevens geretourneerd die de som vormden. Door echter de methode 'DataFrame.sum()' toe te wijzen aan een DataFrame-kolom, krijgt u toegang tot elke kolom in het DataFrame, inclusief de somkolom. Eerst maken we een ander dataframe voor dit voorbeeld.


Met behulp van het pd.DataFrame() is ons dataframe gemaakt. We hebben het dataframe gemaakt met drie kolommen: artikel, prijs en btw. Het kolomitem met de tekenreekswaarden ('pen', 'marker', 'liniaal', 'gum', 'potlood', 'klembord', 'nietmachine', 'spelden'), de kolomprijs die de waarden opslaat (20, 15, 10, 3, 5, 30, 35, 10) en de kolom 'belasting' bestaan ​​uit waarden (8, 5, 3, 3, 4, 10, 5, 2). Laten we nu de prijs- en belastingkolomwaarden bij elkaar optellen en de resultaten in een nieuwe kolom opslaan door de originele dataframe-kolommen te behouden.


Zoals kan worden opgemerkt, samen met de nieuwe kolom 'totaal', worden de originele kolommen van het gegeven dataframe ook geretourneerd door de functie. De kolom 'totaal' slaat de som van de waarden van de kolommen 'prijs' en 'belasting' op voor elke 'artikel' -gegevens.

Voorbeeld # 03: De functie sum() gebruiken om de som van gespecificeerde dataframekolommen te bepalen

Om de meerdere kolommen van het dataframe bij elkaar op te tellen, kunnen we een lijst specificeren met de labels van kolommen en vervolgens de methode sum() toepassen op de lijst om de som te vinden. Net als eerdere voorbeelden zullen we eerst het dataframe maken.


We hebben ons dataframe gemaakt met vier kolommen 'studenten', 'marks1', 'marks2' en 'marks3'. De kolom 'studenten' slaat de gegevens op ('Larry', 'James', 'Rob', 'Arya', 'Max', 'Ben', 'Gwen', 'Bill') en de kolom 'marks1' waarin de waarden (8, 9, 6, 8, 10, 7, 9, 9) terwijl de kolommen 'marks2' en 'marks3' de numerieke waarden opslaan (6, 6, 8, 6, 7, 9, 10, 9 ) en (7, 6, 9, 7, 8, 7, 10, 10) respectievelijk.


Eerst hebben we een lijstobject gemaakt met kolomlabels 'studenten', 'marks1' en 'marks3'. Vervolgens wordt de methode sum() toegepast op de lijst. De functie heeft de waarden van de kolommen marks1 en marks3 alleen samengevat omdat de kolom 'studenten' niet-numeriek is, dus de functie sum() kan de som voor de waarden van kolom 'studenten' niet vinden. We hebben de som van de waarden van de kolommen 'marks1' en 'marks3' opgeslagen in de kolom 'sum'.

Voorbeeld # 04: Kolommen van Panda's-dataframe toevoegen die voldoen aan een gespecificeerde voorwaarde

In dit voorbeeld voegen we de waarden van de opgegeven kolommen toe als ze aan de opgegeven voorwaarde voldoen.


Er zijn 5 kolommen in het nieuw gemaakte dataframe, d.w.z. 'bedrijf', 'week1_sales', 'week2_sales', 'week3_sales' en 'filialen'. Laten we nu aannemen dat we de waarde van de laatste kolom niet willen toevoegen wanneer we de som van de waarden van de gegeven dataframerijen toevoegen of vinden. Laten we zeggen dat we alleen de kolomwaarden wilden toevoegen met het woord 'week' in hun labels. Er kan een lijstbegrip worden gemaakt om te bepalen of het woord 'week' in een kolomlabel voorkomt of niet.


Nu hebben we de kolommen opgehaald met het woord 'week' in hun labels. We kunnen de kolommen met het woord 'week' samenvatten met het argument axis=1 in de functie sum().


Op deze manier kunnen we veilig gegevens over kolommen rijsgewijs samenvatten zonder kolommen op te nemen die we niet willen.

Voorbeeld # 5: Bepaal de som na het groeperen van de gegevens van het dataframe

We kunnen ook de som van dataframe-kolommen vinden na het groeperen van de gegevens van een of meer kolommen. De methode groupby() wordt gebruikt om de gegevens in categorieën in de kolom te groeperen. Laten we een dataframe maken, zodat we de gegevens van een van de kolommen kunnen groeperen.


Nu zullen we de gegevens in de kolom 'leeftijd' groeperen en de waarden van de kolommen 'score1' en 'score2' voor elke categorie van de groep optellen.


We kunnen zien dat het optellen van de gegevens in het dataframe nadat de gegevenswaarden eerst op leeftijd zijn gegroepeerd, resulteert in een kolomgewijze som, afhankelijk van de leeftijdsgroepen.

Conclusie

In deze zelfstudie hebben we geprobeerd u te leren hoe u de som over dataframes kunt berekenen met behulp van de Pandas-sommethode. We hebben de rij- en kolomgewijze toevoeging van waarden besproken in de voorbeelden van dit bericht. Bovendien hebt u geleerd hoe u kolommen voorwaardelijk kunt toevoegen en hoe u de waarden kunt optellen na het groeperen van de kolom van het dataframe. Nu kunt u mogelijk de kolommen van het dataframe bij elkaar optellen of de waarden in de dataframekolom zelf optellen.