Panda's dataframe uniek

Panda S Dataframe Uniek



De meest populaire Python-bibliotheek die wordt gebruikt in datawetenschap, wordt Panda's genoemd. Het biedt Python-programmeurs krachtige, gebruiksvriendelijke en gegevensanalysetools. Zodra u de fundamentele functies begrijpt en hoe u ze kunt gebruiken, is Pandas een krachtig hulpmiddel voor het wijzigen van gegevens. In 'panda's' zijn de standaardmethoden voor het opslaan van gegevens in tabelvorm de DataFrames. We kunnen enkele 'panda's'-methoden gebruiken om de unieke waarden in de kolom 'panda's' DataFrame te krijgen. Wanneer we unieke waarden in de kolommen van het DataFrame moeten krijgen en geen duplicatie van waarden in de kolom van het 'panda's' DataFrame willen, kunnen we de methoden gebruiken die 'panda's' biedt om dit te doen. Laten we in deze handleiding naar dergelijke methoden kijken, samen met enkele voorbeelden en uitvoer om unieke waarden in de DataFrame-kolom met 'panda's' te krijgen.

Methoden voor het verkrijgen van unieke waarden in de kolommen van 'panda's' DataFrame

We kunnen twee methoden gebruiken om de unieke waarden in de kolommen van het 'panda's' DataFrame te krijgen. We laten de dubbele waarden vallen en krijgen alleen de unieke waarden in de kolommen van DataFrames. De methoden die 'panda's' bieden om deze taak uit te voeren zijn:







  • Door gebruik te maken van de unique() methode.
  • Door de methode drop_dupliactes() te gebruiken.

Nu zullen we beide methoden gebruiken in de 'panda's'-codes om de unieke waarden in de kolommen van het 'panda's' DataFrame te krijgen.



Voorbeeld # 01

De 'Spyder'-app wordt hier gebruikt voor het genereren van deze 'panda's'-codes om die methoden te gebruiken die ons helpen bij het verkrijgen van de unieke waarden in de kolommen van het 'panda's' DataFrame. We moeten de 'panda's'-modules importeren, die nodig zijn voor de 'panda's'-code, voordat we het DataFrame maken. Door de term 'importeren' te gebruiken en 'panda's als pd' te plaatsen, importeren we deze modules.



Nu kunnen we met behulp van 'pd' snel de 'panda's' -functies of -methoden verkrijgen. Vervolgens plaatsen we de 'Subject_data' waarin we 'Naam' toevoegen en in de 'Naam' voegen we de gegevens van de naam toe die 'Roman, William, Peter, Smith, John, Milli, Thomas en James' zijn. Vervolgens voegen we de onderwerpgegevens toe in de 'Subj', die 'Wiskunde, Economie, Wetenschap, Wiskunde, Statistiek, Statistiek, Statistiek en Computer' zijn. Vervolgens converteren we deze 'Subject_data' naar het 'Subject_df' DataFrame met behulp van de 'pd.DataFrame()'-methode. We plaatsen 'Subject_df' in de 'print()'-methode zodat het op de terminal wordt weergegeven.





Nu willen we de unieke waarden in de 'panda's' DataFrame's kolom 'Subj' krijgen. Voor dit doel gebruiken we hier de methode 'unique()' en voegen we de naam van de kolom toe en ook de naam van het DataFrame, zoals hieronder wordt weergegeven. We voegen deze methode toe in de 'print()', zodat het resultaat ook op de terminal wordt weergegeven.



Nu drukken we op 'Shift + Enter' om het resultaat van deze code te krijgen en deze wordt weergegeven op de terminal en wordt ook hier getoond, die het DataFrame met alle waarden bevat. Dit is het originele DataFrame dat we in de code hebben toegevoegd en daaronder worden de unieke waarden van de kolom 'Subj' weergegeven. Het laat de dubbele waarden vallen en geeft de unieke waarden weer van de kolom 'Subj' van het DataFrame.

Voorbeeld # 02

We maken de 'Sample_list' die wat informatie bevat. We voegen 'Layla, 21, 28, 31, 14 en 39' in die als de eerste kolom zal verschijnen wanneer we deze lijst naar het DataFrame converteren. Vervolgens voegen we 'Lusy, 31, 25, 34, 26 en 21' toe als de tweede rij van het DataFrame. Hierna hebben we 'Peter, 38, 20, 20, 35 en 24' en 'Layla 38, 23, 39 24, 23', die de derde en vierde rij van het DataFrame zullen zijn. We voegen ook nog drie gegevens in, namelijk 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' en ook 'Peter, 21, 21, 31, 21, 29' .

Nu converteren we de 'Sample_list' naar de 'DF_Sample', wat de naam is van het DataFrame hier door de functie 'pd.DataFrame()' te plaatsen. We stellen ook de naam van de kolommen van dit DataFrame in en deze namen zijn 'Name, Ass_1, Ass_2, Ass_3, Ass_4 en Ass_5'. Vervolgens gebruiken we de 'print()' die helpt bij het weergeven van het DataFrame 'DF_Sample'. Nu gebruiken we in dit voorbeeld een andere methode om de unieke waarden in de kolom van het DataFrame te krijgen. Deze methode is de 'drop_duplicates()' methode van 'panda's'.

In de methode 'drop_duplicates()' stellen we de naam in van de kolom waar we de unieke waarden in de kolom van het DataFrame willen krijgen. We krijgen unieke waarden van de kolom 'Naam' door de dubbele waarden in deze kolom te verwijderen met behulp van de methode 'drop_duplicates()' en deze unieke waarden ook weer te geven met de functie 'print()' hier.

De namen die worden gedupliceerd, worden verwijderd en unieke waarden worden weergegeven na het toepassen van de methode 'drop_duplicates()'. U kunt zien dat de naam 'Layla' in drie cellen van de kolom 'Naam' wordt weergegeven. Maar wanneer de methode 'drop_duplicates()' op deze kolom wordt toegepast, worden alle dubbele waarden verwijderd en is er één 'Layla' -naam op het scherm verschenen. Nadat de dubbele waarden waren verwijderd, verscheen het nieuwe DataFrame dat de unieke waarden in deze kolom 'Naam' bevat. Op deze manier kunnen we de dubbele waarden laten vallen en de unieke waarde in de DataFrame-kolom krijgen met behulp van de 'drop_duplicates()'-methode.

Voorbeeld # 03

Hetzelfde DataFrame wordt opnieuw gebruikt en nu passen we hier de methode 'uniek()' toe. Met de “unique()” methode plaatsen we zowel de naam van de kolom als de naam van het DataFrame waarop we deze “unique()” methode willen toepassen om de unieke waarden te verkrijgen. Hierdoor worden alleen de unieke waarden van die kolom weergegeven en worden deze waarden niet weergegeven in de vorm van DataFrame.

Hier bevat het DataFrame zeven waarden in de kolom 'Naam', maar wanneer we de methode 'unique()' toepassen op deze kolom, zijn er slechts vier waarden verschenen en dit zijn de unieke waarden van die kolom. Het geeft geen dubbele waarden weer.

Voorbeeld # 04

Het DataFrame dat we in dit voorbeeld maken, is de 'F_G_df'. We voegen 'My_fruits' en 'my_Vegs' in dit DataFrame in. De kolom 'My_fruits' bevat 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear en Apple'. Vervolgens hebben we de 'My_Vegs' die de namen bevat van de groenten die 'Chili, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic en Ginger' zijn. Dit DataFrame bevat slechts twee kolommen.

Nu krijgen we de unieke waarden in beide kolommen met behulp van de methode 'unique()'. We noemen de naam van het DataFrame. Plaats vervolgens de kolom eerste kolomnaam. Hierna gebruiken we de append() methode. In deze bijlage plaatsen we opnieuw de naam van het DataFrame en de tweede kolomnaam en plaatsen we de methode “unique()”. Dit krijgt de unieke waarden van beide kolommen en voegt vervolgens de unieke waarden van beide kolommen toe en verschijnt ze op het scherm.

Het DataFrame wordt eerst gerenderd met daarin alle waarden. Hierna wordt de methode “unique()” toegepast en worden de unieke waarden van beide kolommen hieronder weergegeven. In deze code krijgen we de unieke waarden in de meerdere kolommen van het DataFrame met behulp van de 'unique()'-methode.

Conclusie

De volledige uitleg over het verkrijgen van de unieke waarden in de DataFrame-kolom vindt u in deze handleiding. We hebben de methoden 'unique()' en 'drop_duplicates()' besproken die ons helpen bij het verkrijgen van de unieke waarden van de DataFrame-kolom. We hebben onderzocht hoe we deze methoden in de 'panda's'-code kunnen gebruiken door deze methoden hier in onze codes te gebruiken. We hebben verschillende voorbeelden in deze handleiding geïllustreerd en u laten zien hoe u de unieke waarden van één kolom kunt krijgen met behulp van de 'unique()'-methode en de 'drop_duplicates()'-methode. We hebben ook onderzocht hoe u de unieke waarden in meerdere kolommen kunt krijgen door gebruik te maken van de 'unique()'-methode in deze handleiding.