Voorbeeld() Functie in R

Voorbeeld Functie In R



In R krijgen we willekeurige voorbeeldwaarden van een vector of een lijst met behulp van de functie sample(). Het stelt ons in staat om willekeurig een subset van gegevens te selecteren die nuttig is in veel statistische toepassingen. Als de invoer een lijst is in de functie sample(), zal de uitvoer ook een lijst zijn met hetzelfde aantal elementen, maar met de geselecteerde elementen. Dit artikel demonstreert de functie sample() van R met de implementatie die de verschillende argumenten instelt.

Voorbeeld 1: de functie Sample() gebruiken met het gegevensargument

De functie sample() van R moet worden geleverd met de voorbeeldgegevens om willekeurig een getal te genereren. De voorbeeldgegevens zijn het vereiste argument van de functie sample() waarvan de code als volgt wordt gegeven:

gegevensX < - C ( 10 , twintig , 30 , 40 , vijftig , 60 , 70 , 80 , 90 , 100 )

steekproef ( gegevensX , 3 )

steekproef ( gegevensX , 3 )

Hier genereren we eerst de vectoren van de integer-elementen binnen de variabele 'dataX'. Vervolgens roepen we de functie sample() tweemaal aan in de code en geven we de 'dataX'-vector door die we eerder hebben gegenereerd als een argument. Het eerste gebruik van de steekproef (dataX, 3) neemt een willekeurige steekproef van drie elementen uit de 'dataX' -vector. De resultaten zijn een willekeurige permutatie van drie elementen uit 'dataX'. Daarna gebruiken we opnieuw de steekproef (a, 5) die nog een onafhankelijke willekeurige steekproef van drie elementen uit de 'dataX' -vector neemt. Deze keer is de uitkomst totaal verschillend van de vorige.







De uitvoer toont de verschillende elementen door tweemaal de functie sample() aan te roepen. Merk op dat elke keer dat we de steekproef willekeurig maken, er verschillende elementen uit de vectoren worden verkregen:





Voorbeeld 2: de functie Sample() gebruiken met het argument Vervangen

Verder hebben we het argument 'vervangen' van de functie sample() die de logische waarden aanneemt. Een soortgelijk element kan meerdere keren worden geselecteerd als het element wordt gesampled met de vervangingsoptie TRUE. Als de waarde echter is ingesteld op FALSE, kan er slechts één selectie van elk element zijn, waardoor de elementen worden gesampled zonder vervanging.





willekeurige nummers = C ( elf , 25 , 12 , 89 , Vier vijf , 16 , 67 , 38 , 96 , 55 , 73 )

steekproef ( willekeurige nummers , 4 , vervangen = WAAR )

steekproef ( willekeurige nummers , 5 , vervangen = WAAR )

Hier definiëren we eerst de vector met enkele numerieke waarden in de variabele 'random_numbers'. Daarna roepen we de functie sample() aan waarbij de 'willekeurige_getallen' als argument wordt doorgegeven. De waarde van '4' wordt opgegeven voor de functie sample() die aangeeft dat deze slechts vier willekeurige waarden selecteert uit de vectoren in 'random_numbers'.

Vervolgens geeft de functie vervangen=TRUE in de functie sample() aan dat elke waarde meer dan eens kan worden geselecteerd. Vervolgens gebruiken we opnieuw de functie sample() die deze keer '5' willekeurige waarden uit de vectoren selecteert. Op dezelfde manier stellen we het argument vervangen in op 'TRUE' zoals eerder voor de meervoudige selectie-opties voor elke waarde.



Zoals we kunnen zien, toont de eerste output de vector van 4 willekeurig geselecteerde elementen uit de 'random_numbers' vector. De volgende uitvoer toont echter een vector van '5' willekeurig geselecteerde elementen:

Voorbeeld 3: de functie Sample() gebruiken met het argument Grootte

Het volgende argument dat de functie sample() doorgeeft, is de 'grootte'. De 'grootte' is een optionele parameter die de waarde van de te trekken monsters aangeeft. De code van de functie sample() met de parameter 'size' wordt als volgt gegeven:

vectoren < - 1 : 10

steekproef ( vectoren , maat = 5 )

Hier wordt een numerieke vector gedefinieerd als een reeks gehele getallen van 1 tot 10 in de variabele 'vectoren'. De functie sample() wordt vervolgens gebruikt om willekeurige elementen uit de vector te selecteren. Zoals we kunnen zien, heeft de functie sample() twee argumenten nodig. Het eerste argument zijn de vectoren waaruit we het monster halen. Het volgende argument is de grootte die wordt opgegeven met de waarde '5', wat aangeeft dat er slechts vijf elementen zijn om uit de vector te selecteren.

Daarom worden de geselecteerde elementen in willekeurige volgorde geretourneerd als een nieuwe vector in de volgende uitvoer:

Voorbeeld 4: de functie Sample() gebruiken voor de R-lijst

Bovendien kan de functie sample() worden gebruikt voor de lijst in R. In dit gedeelte van het voorbeeld worden willekeurige waarden uit de lijst gehaald.

R_lijst < - lijst ( 1 : 4 ,

913 ,

C ( 'X' , 'JJJ' , 'GOED' ) ,

'ZZZ' ,

5 )

resultaat < - R_lijst [ steekproef ( 1 :lengte ( R_lijst ) , maat = 4 ) ]

resultaat

Hier wordt de lijst met 'R_list' gedefinieerd met elementen van verschillende typen, waaronder een numerieke vector, een enkel getal, een tekenvector, een tekenreeks en een ander getal. Daarna maken we een 'resultaat' -variabele waar de functie sample () wordt aangeroepen.

Binnen de functie sample() hebben we de expressie '1:length(R_list)' ingesteld die de vectoren van indices aangeeft om doorheen te samplen. Vervolgens hebben we een argument 'grootte' om het aantal elementen te specificeren dat moet worden bemonsterd, namelijk '4'. Daarom genereert de 'R_list' drie willekeurig geselecteerde elementen uit de lijst van 'R_list'. Aangezien de elementen in de lijst van 'R_list' van verschillende typen zijn, kunnen de resulterende elementen in 'result' ook van verschillende typen zijn.

De uitvoer vertegenwoordigt de nieuwe lijst die een willekeurige subset van de oorspronkelijke lijst bevat:

Voorbeeld 5: de functie Sample() gebruiken met het Prob-argument

Daarnaast hebben we de parameter 'prob' van de functie sample(). Het argument 'prob' geeft de waarschijnlijkheid van het geselecteerde element in de vector. Merk op dat wordt aangenomen dat alle elementen een gelijke waarschijnlijkheid hebben als het argument 'prob' niet wordt gebruikt.

mijn data = C ( 31 , 99 , 5 , 24 , 72 )

steekproef ( mijn data , maat = 10 , vervangen = WAAR ,

waarschijnlijk = C ( 0,5 , vertegenwoordiger ( 0.1 , 4 ) ) )

Hier wordt naar de elementen van numerieke vectoren verwezen naar de 'my_data'. In de volgende stap noemen we de functie sample() waarbij de 'my_data' wordt doorgegeven aan willekeurig geselecteerde 10 elementen ervan. Vervolgens wordt het argument 'grootte' gedefinieerd dat specificeert dat de waarde die willekeurig moet worden geselecteerd, de grootte '10' moet hebben. Daarna kennen we 'TRUE' toe aan het argument 'replace', wat betekent dat elk geselecteerd element in de vector wordt vervangen voordat het volgende wordt geselecteerd. Het derde argument dat wordt gedefinieerd in de functie sample() is 'prob', wat de waarschijnlijkheid definieert van elk element in de 'my_data'-vector die moet worden geselecteerd. De waarschijnlijkheid van het eerste element is ingesteld op '0,5'. Voor de overige vier vectorelementen is de waarschijnlijkheid '0,1'.

De volgende uitvoer wordt opgehaald met de hoogste waarschijnlijkheid van het eerste element in de vectoren zoals verwacht:

Voorbeeld 6: de functie Sample() gebruiken om de barplot weer te geven

Ten slotte wordt de functie sample() gebruikt om de barplot in R te construeren om de verdeling van een categorische variabele met een gegeven waarschijnlijkheidsverdeling te visualiseren.

voorbeeld_gegevens = C ( 1 , 2 , 3 )

barplot ( tafel ( steekproef ( voorbeeld_gegevens , maat = 500 , vervangen = WAAR , waarschijnlijk = C ( .30 , .60 , .10 ) ) ) )

Hier, na het definiëren van de 'sample_data' met de vector van een geheel getal, genereren we de barplot door de functie sample() in te zetten. Eerst roepen we de barplot aan die de functie table() aanroept om een ​​frequentietabel van de resulterende steekproef te maken. Vervolgens specificeren we de functie sample() binnen de functie table() waar een willekeurige steekproef van grootte 1000 wordt getrokken uit een vector van gehele getallen 1 tot 3. Vervolgens wordt het argument 'prob' gebruikt om de waarschijnlijkheid van het selecteren van elk geheel getal te specificeren .

Zoals we nu kunnen zien, wordt de barplot als volgt weergegeven met de drie staven, één voor elk geheel getal, en de hoogte van de staven is relevant voor het gehele getal dat in de steekproef voorkomt:

Conclusie

We hebben met verschillende voorbeelden gezien hoe de functie sample() werkt. De functie sample() wordt gebruikt met verschillende argumenten waarbij de voorbeeldgegevens vereist zijn en alle andere argumenten optioneel zijn en in specifieke gevallen worden aangeroepen. De functie sample() is echter handig bij statistische analyse of bij het werken met grote datasets.