Panda's behoren tot de meest populaire tools die tegenwoordig door datawetenschappers worden gebruikt om tabelgegevens te analyseren. Om met tabelinhoud om te gaan, biedt het een snellere en effectievere API. Telkens wanneer we dataframes bekijken tijdens analyse, stelt Pandas automatisch verschillende weergavegedragingen in op standaardwaarden. Deze weergavegedragingen omvatten het aantal rijen en kolommen dat moet worden weergegeven, de nauwkeurigheid van de floats in elk gegevensframe, kolomgroottes, enzovoort. Afhankelijk van de vereisten moeten we deze standaardinstellingen mogelijk af en toe wijzigen. Panda's hebben verschillende benaderingen voor het wijzigen van standaardgedrag. Door gebruik te maken van het kenmerk 'opties' van panda's, konden we dit gedrag veranderen.
Panda's geven maximale rijen weer
Telkens wanneer u probeert een enorm gegevensframe af te drukken dat meer rijen en kolommen bevat dan de vooraf gedefinieerde drempel, wordt de uitvoer bijgesneden. Om alle rijen in het DataFrame weer te geven, leert u in deze zelfstudie hoe u de weergave-opties van Panda's kunt aanpassen. Panda's leggen standaard een limiet op aan het aantal kolommen en rijen dat het vertoont. Hoewel dit handig kan zijn voor het lezen van inhoud, veroorzaakt het vaak frustratie als de informatie die u moet bekijken niet wordt weergegeven. Hier zullen we de onderstaande methoden gebruiken met hun syntaxis om alle kolommen van het dataframe weer te geven.
to_string()
set_option()
optie_context()
We zullen het gebruik van al deze methoden leren met praktische implementatie om maximale rijen in het verstrekte dataframe weer te geven.
Voorbeeld # 1: Panda's gebruiken to_string() Methode
Deze demonstratie leert ons om maximale rijen in een dataframe op de terminal weer te geven met behulp van de panda's 'to_string()' -methode.
Voor de compilatie en uitvoering van de voorbeeldprogramma's hebben we de tool 'Spyder' gekozen. In deze handleiding zullen we deze tool gebruiken voor de uitvoering van al onze voorbeelden. We hebben de tool 'Spyder' gelanceerd om te beginnen met het schrijven van het python-script. Beginnend met de code, moeten we eerst de benodigde bibliotheken in ons python-bestand laden, zodat we de functies ervan kunnen gebruiken. De modulebibliotheek die we hier nodig hebben, is de 'Panda's'. Dus hebben we het geïmporteerd in ons python-bestand en een alias gegeven aan 'pd'.
Omdat de hoofdbewerking van dit artikel is om de maximale rijen van een dataframe weer te geven, hebben we eerst een dataframe nodig. Het is nu aan jou of je liever een dataframe wilt genereren of een CSV-bestand wilt importeren. We hebben een voorbeeld-CSV-bestand geïmporteerd. Voor het inlezen van een CSV-bestand in het python-programma hebben we de panda's 'pd.read_csv()'-functie gebruikt. Tussen de haakjes van deze functie hebben we het CSV-bestand opgegeven waarvan we het display willen lezen, namelijk 'industry.csv'. We hebben een variabele 'df' geconstrueerd om de uitvoer op te slaan die is gegenereerd door het lezen van het verstrekte CSV-bestand. Vervolgens hebben we de methode 'print()' aangeroepen om het dataframe weer te geven.
Wanneer we dit python-programma uitvoeren door op de optie 'Bestand uitvoeren' te klikken, wordt een dataframe weergegeven op de console. U kunt zien dat er 43 rijen zijn in het onderstaande resultaat, maar dat er slechts tien worden weergegeven. Dit komt omdat de standaardwaarde van de Pandas-bibliotheek slechts 10 rijen is.
We zullen de panda-methode 'to_string' gebruiken om alle rijen hier weer te geven. De eenvoudigste manier om het maximale aantal rijen uit een dataframe weer te geven, is met deze techniek. Omdat het echter het volledige dataframe in een enkele string verandert, wordt het niet aanbevolen voor zeer grote datasets (in de miljoenen). Desalniettemin werkt dit effectief voor datasets die in de lengte van duizenden lopen.
We hebben de bovenstaande syntaxis gevolgd voor de functie 'to_string()'. We hebben eenvoudigweg de methode 'to_string()' aangeroepen met de naam van ons dataframe. Vervolgens hebben we deze methode in de functie 'print()' geplaatst om deze weer te geven wanneer deze wordt aangeroepen.
De output-snapshot toont ons een dataframe met alle rijen die op de terminal worden weergegeven.
Voorbeeld # 2: Panda's set_option methode gebruiken
De tweede methode die we in deze handleiding zullen oefenen, is de panda's 'set_option()' om de maximale rijen van het verstrekte dataframe weer te geven.
In het python-bestand hebben we de panda-bibliotheek geïmporteerd om toegang te krijgen tot de bovengenoemde functie. We hebben de panda's 'pd.read_csv()' gebruikt om het meegeleverde CSV-bestand te lezen. We hebben de functie 'pd.read_CSV()' aangeroepen met de naam van het CSV-bestand dat we tussen de haakjes willen gebruiken, namelijk 'Sampledata.csv'. Houd bij het importeren van het CSV-bestand rekening met de huidige werkdirectory van het Python-programma. Uw CSV-bestand moet in dezelfde map worden geplaatst; anders krijgt u een foutmelding 'bestand niet gevonden'. We hebben een variabele 'sample' gemaakt om het dataframe uit het CSV-bestand op te slaan. We hebben de methode 'print()' aangeroepen om dit dataframe te tonen.
Hier hebben we onze uitvoer waar slechts tien rijen worden weergegeven. Het maximale aantal aangegeven rijen is 99. Alle andere rijen tussen de eerste 5 en de laatste vijf rijen worden afgekapt.
Om de maximale rijen weer te geven die 99 zijn voor dit dataframe, gebruiken we de functie 'set_option()' van de panda's-module. Panda's worden geleverd met een besturingssysteem waarmee u het gedrag en de weergave kunt wijzigen. Deze methode stelt ons in staat om de weergave in te stellen op een volledig dataframe in plaats van een afgekapt frame. Panda's bieden de functie 'set_ option()' voor het weergeven van alle rijen van het gegevensframe.
We hebben de 'pd.set_option()' aangeroepen. Deze functie heeft parameters “display.max_rows”. De 'display.max_rows' specificeert het maximale aantal rijen dat zal worden getoond bij het weergeven van een dataframe. De waarde van 'max_rows' is standaard ingesteld op 10. Als 'Geen' is geselecteerd, betekent dit alle rijen in het gegevensframe. Omdat we alle rijen willen weergeven, stellen we deze in op 'Geen'. Ten slotte hebben we de functie 'print()' gebruikt om het dataframe met maximale rijen weer te geven.
Dit levert het resultaat op dat in de onderstaande snapshot wordt weergegeven.
Voorbeeld # 3: Panda's gebruiken option_context() Method
De laatste methode die we hier bespreken, is de 'option_context()' om alle rijen van het dataframe weer te geven. Hiervoor hebben we het panda-pakket geïmporteerd in het python-bestand en zijn we begonnen met het schrijven van de code. We hebben de functie 'pd.read_csv()' gebruikt om het door ons opgegeven CSV-bestand te lezen. We hebben een variabele 'dalta' gemaakt om het dataframe uit het opgegeven CSV-bestand op te slaan. Vervolgens hebben we het dataframe eenvoudig afgedrukt met de 'print()'-methode.
Het resultaat dat we hebben verkregen door de bovenstaande code uit te voeren, toont ons een dataframe met afgekapte rijen.
We zullen nu de panda's 'pd.option_context()' toepassen op dit dataframe. Deze functie is identiek aan 'set_option()'. Het enige verschil tussen de twee benaderingen is dat 'set_option()' de instellingen permanent wijzigt, terwijl 'option _context()' ze gewoon binnen het bereik heeft gewijzigd. Deze methode neemt ook display.max-rijen als parameter, die we hebben ingesteld op 'Geen' om alle rijen van het dataframe weer te geven. Nadat we deze functie hadden aangeroepen, hebben we deze alleen weergegeven via de methode 'print()'.
Hier kunnen we het volledige dataframe bekijken met zijn maximale rijen die 2747 zijn.
Conclusie
Dit artikel richt zich op de weergave-opties van de panda's. Soms moeten we het volledige dataframe op de terminal bekijken. Panda's geven ons daarvoor verschillende mogelijkheden. In deze handleiding hebben we drie van deze strategieën gebruikt. Het eerste voorbeeld was gebaseerd op het gebruik van de methode 'to_string()'. Onze tweede instantie leert ons om de 'set_option()' te implementeren terwijl de laatste illustratie de 'option_context()' methode uitvoert. Al deze technieken worden gedemonstreerd om u vertrouwd te maken met de alternatieve manieren waarop panda's ons bieden om het gewenste resultaat te bereiken.