Hoe te werken met normale verdeling in MATLAB met behulp van fitdist

Hoe Te Werken Met Normale Verdeling In Matlab Met Behulp Van Fitdist



Normale verdeling is een statistische techniek die veel wordt gebruikt in kunstmatige intelligentie, datawetenschap, machinaal leren en vele andere gebieden. Het is een waarschijnlijkheidsverdeling die gemiddeld symmetrisch is en ook wel de Gaussiaanse verdeling wordt genoemd vanwege de vorm die deze in een grafiek aanneemt. Het laat zien dat de gegevenswaarden die dicht bij het gemiddelde liggen vaker voorkomen dan gegevenswaarden die ver van het gemiddelde liggen. In een grafiek vormt de normale verdeling een belcurve.

Het vinden van een normale verdeling van een dataset is geen gemakkelijke taak; we kunnen het echter in MATLAB uitvoeren met behulp van de fitdist() functie. Lees deze handleiding voor meer informatie over het werken met de normale verdeling in MATLAB met behulp van de fitdist() functie.

Wat is normale verdeling

A normale verdeling ook wel een Gaussiaanse verdeling genoemd, wordt gedefinieerd met behulp van twee parameters; gemiddelde en standaardafwijking van de gegevenspunten. Het gemiddelde meet het gemiddelde van gegevenswaarden, terwijl de standaardafwijking meet hoe gegevenswaarden rond het gemiddelde zijn verspreid. Met de combinatie van zowel de gemiddelde als de standaarddeviatie kunnen we berekenen normale verdeling uit de volgende formule:









Waar:



  • X vertegenwoordigt gegevenssetwaarden.
  • f(x) vertegenwoordigt de waarschijnlijkheidsfunctie.
  • M geeft de
  • P geeft de standaarddeviatie aan.

Normale verdeling uitvoeren in MATLAB met behulp van de functie fitdist()

Met MATLAB kunnen we de normale verdeling van willekeurige variabelen met behulp van de ingebouwde fitdist() functie. Deze functie produceert een normale kansverdeling object door de gegeven verdeling aan te passen aan de invoergegevens. De normale verdeling accepteert twee parameters als invoer: zowel de standaardafwijking als het gemiddelde. Een standaardnormale verdeling heeft een gemiddelde waarde van nul en een standaardafwijking van 1. Dit betekent dat de normale verdeling is gecentreerd op nul en de waarden van de verdelingen zijn gelijkmatig verdeeld over beide zijden van het gemiddelde.





Syntaxis

De fitdist() in MATLAB kan op verschillende manieren worden gebruikt:



pd = fitdist ( X , afstandsnaam )
pd = fitdist ( X , afstandsnaam , Naam , Waarde )
pdca , gn , gl ] = fitdist ( X , afstandsnaam , 'Door' , groepsvar )

Hier:

  • De functie pd = fitdist(x,distnaam) is verantwoordelijk voor het aanpassen van de door distname geleverde verdeling aan de gegevens in kolomvector x om een ​​waarschijnlijkheidsverdelingsobject te produceren.
  • De functie pd = fitdist(x,distname,Name,Value) is verantwoordelijk voor het bouwen van het kansverdelingsobject met een of meer naam-waardepaarargumenten die extra parameters specificeren.
  • De functie [pdca,gn,gl] = fitdist(x,distname,’By’,groupvar) is verantwoordelijk voor het aanpassen van de kansverdeling gedefinieerd door distname aan de gegevens in kolomvector x op basis van de groeperingsvariabele groupvar om kansverdelingsobjecten te genereren. Het geeft een celarray van aangepaste waarschijnlijkheidsverdelingsobjecten terug, aangeduid als pdca, een celarray van groepslabels, aangeduid als gn, en een celarray van groeperende variabele niveaus, aangeduid als gl.

Voorbeeld 1: Hoe u een normale verdeling kunt vinden met behulp van de functie fitdist(x,distname).

Dit voorbeeld past bij a normale verdeling naar de voorbeeldgegevens z met behulp van de fitdist() functie.

patiënten laden
Met = Gewicht ;
pd = fitdist ( Met , 'Normaal' )

Voorbeeld 2: Normale verdeling vinden met behulp van fitdist(x,distname,Name,Value) Functie

In dit voorbeeld gaan we een kerneldistributie aanpassen aan de voorbeeldgegevens met behulp van de fitdist() functie in MATLAB.

patiënten laden
Met = Gewicht ;
pd = fitdist ( Met , 'Kernel' , 'Kernel' , 'epanechnikov' )

Voorbeeld 3: Hoe u een normale verdeling kunt vinden met behulp van de functie fitdist(x,distname,’By’,groupvar)

De onderstaande MATLAB-code past normale verdelingen naar gegroepeerde gegevens, berekent en plot de pdf van beide groepen gegevens.

patiënten laden
Met = Gewicht ;
[ pdca , gn , gl ] = fitdist ( Met , 'Normaal' , 'Door' , Geslacht )
vrouwelijk = pdca { 1 }
mannelijk = pdca { 2 }
z_waarden = 80 : 1 : 220 ;
vrouwelijkpdf = pdf ( vrouwelijk , z_waarden ) ;
mannelijkpdf = pdf ( mannelijk , z_waarden ) ;
figuur
verhaallijn ( z_waarden , vrouwelijkpdf , 'Lijnbreedte' , 2 )
hou vol
verhaallijn ( z_waarden , mannelijkpdf , 'Kleur' , 'R' , 'Lijnstijl' , ':' , 'Lijnbreedte' , 2 )
legende ( gn , 'Plaats' , 'Noordoosten' )
afhouden

Conclusie

Het vinden van de normale verdeling van een dataset is een statistische techniek die veel wordt gebruikt in machine learning, kunstmatige intelligentie, datawetenschap en vele andere gebieden. Het kan worden gedefinieerd met behulp van twee parameters; zowel de gemiddelde als de standaarddeviatie van de gegevenspunten. We kunnen de dataset inpassen in de normale verdeling object met behulp van de fitdist() functie. In deze gids vindt u de basisbeginselen van het normale verdeling functie en hoe u ermee kunt werken in MATLAB met behulp van de fitdist() functie.