Panda's opnieuw indexeren

Panda S Opnieuw Indexeren



'In 'panda's' kunnen we veel informatie opslaan in tabelvorm, ook wel bekend als het DataFrame. De 'panda's' vergemakkelijken ons met de 'DataFrame()'-methode voor het construeren van het DataFrame. Het DataFrame bevat indexen en we kunnen ook de indexen van het DataFrame wijzigen door gebruik te maken van de 'panda's'-functies. De methode die we gebruiken voor het opnieuw indexeren van het DataFrame is de 'reindex()'-methode. Deze methode helpt bij het wijzigen van de indexwaarden van de rij en de indexwaarden van de kolommen. Door deze methode te gebruiken, kunnen we de standaardindex van het DataFrame wijzigen en kunnen we ook de index wijzigen die we hebben ingesteld tijdens het maken van het DataFrame. We zullen de 'reindex()'-methode gebruiken in onze 'panda's'-voorbeelden in deze tutorial en zullen dit concept hier diepgaand uitleggen.'

Voorbeeld # 01

De tool 'Spyder' helpt ons bij het ontwikkelen van de 'panda's'-code hier in deze zelfstudie, en we beginnen onze code met het trefwoord 'import', wat zal helpen bij het importeren van de functie 'panda's'. We plaatsen 'panda's als pd' na het typen van de 'import'. Hierna maken we het DataFrame door 'pd.DataFrame()' te typen. We schrijven deze 'pd' hier omdat het 'DataFrame()' de methode van 'panda's' is. De 'value_df' is de naam van de variabele waarin het DataFrame is opgeslagen. We voegen 'RandomName' toe, wat de kolomnaam is, en de 'RandomName' bevat 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander en Samuel'.







Dan hebben we 'Value_1', waarin we '16, 29, 24, 35, 44, 50, 69, 74 en 88' hebben ingevoegd. Dan komt 'Value_2' en we hebben '25, 38, 42, 56, 54, 65, 78, 89 en 99' toegevoegd. Nu komt de 'Value_3' als volgende en we plaatsen '36, 48, 52, 69, 74, 75, 87, 91 en 69' erin. Hierna is de kolom 'Value_4' aanwezig, waar we '52, 64, 72, 88, 82, 95, 97, 21 en 39' hebben ingevoegd. De laatste kolom is hier de kolom 'Value_5', en in deze kolom zijn de waarden die we hebben toegevoegd '66, 78, 82, 99, 34, 45, 57, 61 en 89'. Hierna gebruiken we de functie “print()” waarin “Values_df” zo wordt toegevoegd. Het wordt afgedrukt op de terminal.




Nadat we op 'Shift + Enter' hebben gedrukt, kunnen we eenvoudig het resultaat van onze codes krijgen in de 'Spyder' -app. Hier retourneert deze code het DataFrame met de standaardindex. Nu zullen we de methode 'reindex()' toepassen om dit DataFrame opnieuw te indexeren in 'panda's'.




De functie 'reindex()' wordt hier gebruikt voor het opnieuw indexeren van de indexwaarde van de rij. In het bovenstaande DataFrame kunt u zien dat de standaardindexwaarden van de rij worden weergegeven en nu passen we de methode 'reindex()' toe voor het opnieuw indexeren van die rij-indexen. We plaatsen de naam van het DataFrame en vervolgens de methode 'reindex()' waarin we die indexwaarden plaatsen die we aan het bovenstaande DataFrame willen toevoegen. We plaatsen 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H en ind_I' in de functie 'reindex()'. De indexen van deze rijen worden dus bijgewerkt op het DataFrame wanneer we deze code uitvoeren.






De waarden van de index van de rij worden in deze uitkomst weergegeven en u kunt zien dat de DataFrame-waarden hier niet worden weergegeven en dat de 'NaN' -waarden zijn verschenen. Dit komt omdat de nieuwe indexwaarden niet overeenkomen met de vorige indexwaarden van het DataFrame. Wanneer de nieuwe index en de oude index niet overeenkomen, wordt daar 'Nan' weergegeven. Deze 'NaN' -waarden verschijnen standaard wanneer we de index wijzigen en komen niet overeen met de vorige index.



Voorbeeld # 02

We veranderen nu de kolomindexwaarden van de 'Value_df', die we eerder in voorbeeld 1 hebben gemaakt. Na het afdrukken van de 'Value_df', plaatsen we de 'column' -variabele en voegden er enkele waarden aan toe. We voegen 'a_1, b_1, c_1, d_1 en e_1' toe. Nu willen we deze waarden aanpassen als de index van de kolommen, dus hiervoor gebruiken we de methode 'reindex()' en plaatsen we de naam van de variabele 'kolom' waarin de nieuwe kolomindexwaarden worden opgeslagen en stel ook de 'as' in op 'kolommen', zodat de index van de kolomas wordt bijgewerkt. We plaatsen de methode 'reindex()' in de 'print()', zodat deze ook op de terminal wordt weergegeven.


Omdat we de methode 'reindex()' hebben gebruikt, worden de kolomindexwaarden die aanwezig zijn in het eerste DataFrame bijgewerkt en worden nieuwe waarden toegevoegd in het bijgewerkte DataFrame. U kunt ook opmerken dat alle waarden van het DataFrame worden geconverteerd naar 'NaN' omdat beide indexwaarden van kolommen verschillend zijn.

Voorbeeld # 03

De 'Programming_data' in deze code bevat 'P_Languages', waar we 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java en JavaScript' hebben toegevoegd. Dan hebben we 'Uren' waarin we '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs en 6_hrs' plaatsen. Hierna wordt de 'P_Code' ingevoerd en voegen we '11523, 12423, 12321, 11456, 11454, 12267, 13106 en 14123' in. We voegen de variabele 'p_index' toe en plaatsen 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G en Pro_H'.

Deze waarden worden gebruikt als de indexwaarden van de rijen. We wijzigen de 'Programming_data' in het 'Programming_df' DataFrame. We voegen ook de 'p_index' toe aan dit DataFrame met behulp van de 'index'-methode. We plaatsen 'Programming_df' en vervolgens de 'index'-methode en wijzen hieraan de 'p_index' toe. Nu worden de bovenstaande indexwaarden toegevoegd als de rij-indexwaarden aan het DataFrame. We drukken ook de 'Programming_df' af.

Hierna voegen we enkele nieuwe indexwaarden toe aan de variabele 'new_index', en dit zijn 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 en P_8'. Omdat we de indexwaarden van rijen willen bijwerken, gebruiken we de methode 'reindex()' en plaatsen we 'new_index' als parameter van deze functie en slaan we ook het bijgewerkte DataFrame op in de 'newProgramming_df' en plaatsen we de 'newProgramming_df' in ' print()” voor weergave.


De indexwaarden worden bijgewerkt en we kunnen ook zeggen dat we het DataFrame dat we hebben gemaakt opnieuw hebben geïndexeerd. Alle waarden van het DataFrame worden ook geconverteerd naar “NaN” omdat beide indexwaarden verschillend zijn.

Voorbeeld # 04

We zijn momenteel de indexwaarden van 'Programming_df' van kolommen aan het wijzigen, die we eerder in voorbeeld 3 hebben ontwikkeld. We plaatsen de variabele 'kolom' en voegen er nieuwe waarden in. De 'P_Code, P_Languages, Hours en New' worden toegevoegd aan de variabele 'column'. Vervolgens gebruiken we opnieuw de methode 'reindex()' waarin we de variabele 'column' instellen, die de vorige kolomindexwaarden zal bijwerken en deze nieuwe kolomindexwaarden aan het DataFrame zal toevoegen.

Hier kunt u opmerken dat de nieuwe waarden die we hebben toegevoegd in 'kolom' dezelfde zijn als die we hebben toegevoegd in het bovenstaande DataFrame, maar de volgorde is anders, dus het zal de volgorde van de kolommen veranderen en alle kolommen aanpassen zoals we vermeld in de variabele 'kolom'. We voegen ook nog een indexwaarde toe die niet aanwezig is in het bovenstaande DataFrame, dat hier 'Nieuw' is, dus de 'NaN' -waarden verschijnen in deze kolom.


De volgorde van de kolommen wordt hier gewijzigd en alle waarden worden weergegeven zoals ze aanwezig zijn in de originele DataFrame-kolommen en de kolom 'Nieuw' in het bijgewerkte DataFrame bevat alle 'NaN' -waarden omdat deze kolom niet aanwezig is in het originele DataFrame.

Conclusie

We hebben deze tutorial gepresenteerd die ons helpt om het begrip 'panda's herindexeren' in detail te begrijpen. We hebben besproken hoe we zowel de kolom van een DataFrame als de indexwaarden van de rij opnieuw kunnen indexeren. We hebben uitgelegd dat de functie 'reindex()' van 'panda's' hiervoor wordt gebruikt. We hebben verschillende voorbeelden gedaan waarin we de indexwaarden van de rijen van het DataFrame hebben gewijzigd en ook de indexwaarden van de kolomindex van het DataFrame. We hebben de resultaten van alle codes die we hier in deze tutorial hebben gedaan, weergegeven en ook uitgebreid uitgelegd.