Panda's Kolom invoegen()

Panda S Kolom Invoegen



“Python biedt een breed scala aan datastructuren en bewerkingen voor het verwerken van numerieke en tijdreeksgegevens. Het DataFrame dat we in Panda's hebben gemaakt of geïmporteerd, kan voor verschillende doeleinden worden gebruikt. Ook de kolommen in het dataframe kunnen worden aangepast, samen met de databron. Panda's maken veel van de vervelende, tijdrovende taken die gepaard gaan met het werken met gegevens eenvoudig. Er zijn vier manieren om een ​​kolom toe te voegen aan een DataFrame in Panda's, maar in dit artikel gebruiken we de functie 'insert()' van de kolom van de panda.

Zodra we ons dataFrame in Panda's hebben gebouwd of geladen, zijn er verschillende dingen die we zouden willen bereiken. We kunnen bijvoorbeeld gegevens blijven manipuleren, bijvoorbeeld door de kolommen in het gegevensframe te wijzigen. Vervolgens moeten we begrijpen hoe we kolommen in een gegevensframe kunnen opnemen als de meeste gegevens afkomstig zijn van de ene gegevensprovider, maar sommige gegevens van een andere. Een kolom kan eenvoudig worden toegevoegd aan een Pandas dataFrame.”







Panda's insert() Methode

De laatste kolom van het dataframe wordt gegenereerd door een andere functie. Door de DataFrame 'insert()' -methode te gebruiken, kunt u kolommen tussen huidige kolommen toevoegen in plaats van ze onderaan het panda's DataFrame toe te voegen. Het biedt ons de mogelijkheid om een ​​kolom toe te voegen waar we maar willen, in plaats van gewoon aan het einde. Bovendien biedt het vele manieren om de waarden voor de kolommen toe te voegen. Wanneer u een kolom op een opgegeven positie of index moet toevoegen, is de functie 'insert()' van panda's handig.



Syntaxis voor de Pandas insert() Column



Voorbeeld 1: Kolom invoegen in een gegevensframe met behulp van de methode Panda's insert()

Begin met het eerste voorbeeld van het artikel, waarin we uitleggen hoe u een kolom in een gegevensframe invoegt. Door de tool 'spyder' te gebruiken, kunnen we deze code bewijzen. Eerst genereren we een dataframe met de naam 'course'. We hebben twee kolommen in dit dataframe, 'course_title' en 'fee'. In de kolom “course_title” hebben we een lijst met cursussen “python”, “java”, “object_oriented” en “PHP”. In de tweede kolom 'fee' hebben we de lijst met cursusgelden die is '30000', '25000', '15000' en '22000'. Het weergeven van ons dataFrame, 'cursus', met behulp van 'pd. DataFrame'.





Vervolgens bespreken we de hoofdfunctie van de code, namelijk panda's 'insert() column'. Het is een efficiënte methode om een ​​nieuwe lijst in het dataframe op te nemen. U kunt de nieuwe kolom op elke opgegeven plek toevoegen met behulp van de invoegmethode. Deze methode maakt ook de handmatige toevoeging van een kolom aan een dataframe mogelijk, maar er is minder aanpassingsvermogen.

Door invoegen betekent dat het bron-DataFrame tijdens het proces direct wordt bijgewerkt en dat er geen nieuw DataFrame wordt gemaakt. In dit geval hebben we een nieuwe kolom aan ons dataframe toegevoegd met de naam 'Time_duration' met behulp van de functie 'insert()'. De lijst met waarden die we in deze kolom hebben, zijn '6_months', '3_months', '3months' en '6_months'. We hebben een kolom 'Time_duration' met een index gedefinieerd als '2' in het onderstaande programma. Omdat de index is opgegeven, krijgt het DataFrame een bereik dat begint bij 0 en in stappen toeneemt, dus dit betekent dat deze kolom wordt weergegeven als een derde kolom in het dataframe. Het DataFrame voegt een nieuwe kolom toe met de naam 'Time _duration' met behulp van de functie 'pd.insert()'.



En laten we nu de uitvoer van het programma van bovenaf bespreken. De uitvoer toont een gegevensframe met drie kolommen. De extra kolom wordt toegevoegd aan het einde van het dataframe. Door de methode 'pd.DataFrame.insert()' te gebruiken, kunt u een kolom tussen andere kolommen toevoegen in plaats van ze toe te voegen aan het einde van het panda's DataFrame. 'Time_ duration' is een nieuwe kolom die we hebben toegevoegd met behulp van de 'inserting' functie. Positie '2' verwijst naar de derde kolom in het DataFrame aangezien de positie begint bij 0. De kolom wordt toegevoegd aan de laatste plaats in het dataframe.

Voorbeeld 2:  Kolommen toevoegen aan een gegevensframe met behulp van de functie Pandas insert()

We zullen de methode 'insert()' gebruiken om nieuwe kolommen aan het dataframe toe te voegen. In plaats van extra kolommen aan het einde van de panda's toe te voegen, kunt u ze tussen de bestaande kolommen invoegen. Om een ​​dataframe te genereren dat vergelijkbaar is met het vorige voorbeeld, hebben we drie kolommen genomen en daaraan waarden toegekend. In de eerste kolom, 'Naam', hebben we een lijst met namen die 'Emma', 'Ella', 'Smith' en 'Maxwell' bevatten. In de tweede kolom 'Leeftijd' hebben we de lijst met waarden '29', '36', '39' en '33'.

Daarna drukken we een verklaring 'DataFrame' af. We tonen het dataframe onder de 'dataframe' -instructie. We maken nog een kolom voor het Pandas-dataframe met behulp van de functie 'insert()'. Er moet een lijst worden gemaakt zodat deze als een nieuwe kolom aan onze gegeven dataset kan worden toegevoegd. De methode 'assign()' van het panda's DataFrame kan ook worden gebruikt om meer kolommen toe te voegen. We voegen een nieuwe kolom in met behulp van 'df. invoegen'. In de extra kolom met de naam 'Geslacht' wordt het geslacht weergegeven als 'Man' of 'Vrouw'.

Laten we gewoon een andere verklaring afdrukken, 'Nieuw dataframe'. Er wordt nu een nieuw dataframe gepresenteerd onder het statement 'New Dataframe', met daarin de extra kolom die we hebben toegevoegd met de 'pd. insert()” functie. De kolom met een vergelijkbare naam kan niet worden toegevoegd met de functie 'insert()'. In het geval dat er al een kolom in het gegevensframe bestaat, wordt standaard een waardefout gegenereerd.

In deze uitvoer wordt de kolom die we hebben gemaakt met de functie 'insert()' toegevoegd aan het dataframe. De output toont twee dataframes; het eerste dataFrame is gemaakt met behulp van 'pd.data frame', waarin we twee kolommen hebben, 'Naam' en 'Leeftijd'. De nieuwe kolom 'geslacht' die we hebben toegevoegd met de functie 'insert()' wordt weergegeven in het tweede gegevensframe dat hieronder wordt weergegeven. Dit dataframe laat zien dat er drie kolommen zijn met wat gegevens erin. De index heeft een grootte van '2', wat betekent dat deze vermeldingen heeft van '0 tot 3'. De nieuwe kolom die we aan dit dataframe hebben toegewezen, heeft een indexpositie van '3'.

Conclusie

Een veelgebruikte bewerking voor gegevensanalyse en -update is het toevoegen van kolommen aan DataFrame. Pandas geeft je echter talloze opties om de taak te voltooien door vier verschillende methoden aan te bieden; we gebruiken echter slechts één techniek, namelijk de panadas 'insert()'-kolom, in ons artikel. Een van de moeilijkste onderdelen van het uitbreiden van een DataFrame met nieuwe kolommen is het indexeren. Laten we snel beide voorbeelden beschrijven. We hebben eerst een dataframe met de titel cursus gemaakt en de kolommen 'cursustitel' en 'vergoeding' toegevoegd en waarden aan deze kolom toegewezen. Met behulp van de functie 'insert()' voegen we vervolgens een nieuwe kolom toe aan hetzelfde gegevensframe dat de positie als '2' in de index aangeeft. In het tweede voorbeeld worden twee dataFrames getoond. We hebben twee kolommen gemaakt en enkele waarden in het eerste gegevensframe weergegeven. Vervolgens hebben we met behulp van de functie insert() een nieuwe kolom ingevoegd in het gegevensframe met de naam 'Gender', deze werd ook als '2' in de index geplaatst; nu werd de tabel opnieuw weergegeven, zoals weergegeven in het bovenstaande tweede voorbeeld.

Nadat we bovenstaande technieken onder de knie hebben, kunnen we eenvoudig nieuwe kolommen toevoegen aan het DataFrame.