Quelle est la fonction de distribution d'une variable aléatoire. Fonction de distribution de probabilité d'une variable aléatoire et ses propriétés

Nous avons établi que la série de distribution caractérise complètement une variable aléatoire discrète. Toutefois, cette caractéristique n’est pas universelle. Il n'existe que pour des quantités discrètes. Pour une quantité continue, une série de distribution ne peut pas être construite. En effet, continu valeur aléatoire a une infinité de significations possibles qui comblent complètement une certaine lacune. Il est impossible de créer un tableau listant toutes les valeurs possibles de cette grandeur. Par conséquent, pour une variable aléatoire continue, il n’existe pas de série de distribution au sens où elle existe pour valeur discrète. Cependant, différentes régions de valeurs possibles d'une variable aléatoire ne sont pas également probables, et pour une variable continue, il existe toujours une « distribution de probabilité », mais pas dans le même sens que pour une variable discrète.

Pour caractériser quantitativement cette distribution de probabilité, il convient d'utiliser non pas la probabilité de l'événement R.(X= X), consistant dans le fait que la variable aléatoire prendra une certaine valeur X, et la probabilité de l'événement R.(X<X), consistant dans le fait que la variable aléatoire prendra une valeur inférieure à X. Évidemment, la probabilité de cet événement dépend de X, c'est à dire. est une fonction de X.

Définition. Fonction de distribution Variable aléatoire X fonction appelée F(X), exprimant pour chaque valeur X la probabilité que la variable aléatoire X prendra une valeur inférieure à X:

F(X) = P.(X < X). (4.2)

La fonction de distribution est également appelée fonction de distribution cumulative ou loi intégrale de distribution .

La fonction de distribution est la caractéristique la plus universelle d'une variable aléatoire. Il existe pour toutes les variables aléatoires : discrètes et continues. La fonction de distribution caractérise pleinement une variable aléatoire d'un point de vue probabiliste, c'est-à-dire est l'une des formes de la loi de répartition.

La fonction de distribution permet une interprétation géométrique simple. Considérons la variable aléatoire X sur l'axe Oh(Fig. 4.2), qui, grâce à l'expérience, peut prendre une position ou une autre. Soit un point sur l'axe sélectionné qui a la valeur X. Ensuite, à la suite de l’expérience, la variable aléatoire X peut être à gauche ou à droite du point X. Évidemment, la probabilité que la variable aléatoire X sera à gauche du point X, dépendra de la position du point X, c'est à dire. être fonction de l'argument X.

Pour une variable aléatoire discrète X, qui peut prendre des valeurs X 1 , X 2 , …, xn, la fonction de distribution a la forme

Trouvez et représentez graphiquement sa fonction de distribution.

Solution. Nous définirons différentes valeurs X et trouve pour eux F(X) = = P.(X < X).

1. Si X≤ 0, alors F(X) = P.(X < X) = 0.

2. Si 0< X≤ 1, alors F(X) = P.(X < X) = P.(X = 0) = 0,08.

3. Si 1< X≤ 2, alors F(X) = P.(X < X) = P.(X = 0) + P.(X = 1) = 0,08 + 0,44 = 0,52.

4. Si X> 2, alors F(X) = P.(X < X) = P.(X = 0) + P.(X = 1) + P.(X = 2) = 0,08 + 0,44 + + 0,48 = 1.

Écrivons la fonction de distribution.

Représentons graphiquement la fonction de distribution (Fig. 4.3). A noter qu'en approchant des points de discontinuité par la gauche, la fonction conserve sa valeur (une telle fonction est dite continue à gauche). Ces points sont mis en évidence sur le graphique. ◄

Cet exemple nous permet de conclure que la fonction de distribution de toute variable aléatoire discrète est une fonction en escalier discontinu dont les sauts se produisent en des points correspondant aux valeurs possibles de la variable aléatoire et sont égaux aux probabilités de ces valeurs.

Considérons les propriétés générales fonctions de répartition.

1. La fonction de distribution d'une variable aléatoire est une fonction non négative comprise entre zéro et un:

3. À moins l'infini, la fonction de distribution est égale à zéro, à plus l'infini, elle est égale à un., c'est à dire.

Exemple 4.3. Fonction de distribution de variables aléatoires X a la forme :

Trouvez la probabilité que la variable aléatoire X prendra une valeur dans l’intervalle et aura une probabilité nulle.

Cependant, l'idée d'un événement qui a une probabilité non nulle, mais constitué d'événements avec une probabilité nulle, n'est pas plus paradoxale que l'idée d'un segment qui a une certaine longueur, alors qu'il n'y a pas un seul point sur le segment. a une longueur non nulle. Un segment est constitué de tels points, mais sa longueur n'est pas égale à la somme de leurs longueurs.

Le corollaire suivant découle de cette propriété.

Conséquence. Si X est une variable aléatoire continue, alors la probabilité que cette valeur tombe dans l'intervalle (x 1, x 2) ne dépend pas du fait que cet intervalle soit ouvert ou fermé:

P.(X 1 < X < X 2) = P.(X 1 ≤ X < X 2) = P.(X 1 < XX 2) = P.(X 1 ≤ XX 2).

La fonction de distribution est la plus Forme générale fixant la loi de distribution. Il est utilisé pour spécifier des variables aléatoires discrètes et continues. Il est généralement désigné . Fonction de distribution détermine la probabilité qu'une variable aléatoire prenne des valeurs inférieures à un nombre réel fixe, c'est-à-dire . La fonction de distribution caractérise pleinement une variable aléatoire d'un point de vue probabiliste. On l'appelle également fonction de distribution cumulative.

L'interprétation géométrique de la fonction de distribution est très simple. Si une variable aléatoire est considérée comme un point aléatoire sur un axe (Fig. 6), qui, à la suite d'un test, peut prendre l'une ou l'autre position sur cet axe, alors la fonction de distribution est la probabilité qu'un point aléatoire en conséquence du test tombera à gauche du point.

Pour une variable aléatoire discrète, qui peut prendre des valeurs,, ... ,, la fonction de distribution a la forme

,

où l'inégalité sous le signe somme signifie que la sommation s'étend à toutes les valeurs de plus petite ampleur. De cette formule, il s'ensuit que la fonction de distribution d'une variable aléatoire discrète est discontinue et augmente par sauts lors du passage par des points,,...,, et l'ampleur du saut est égale à la probabilité de la valeur correspondante (Fig. 7 ). La somme de tous les sauts dans la fonction de distribution est égale à un.

Une variable aléatoire continue a une fonction de distribution continue, le graphique de cette fonction a la forme d'une courbe lisse (Fig. 8).

Riz. 7. Fig. 8.

Considérons les propriétés générales des fonctions de distribution.

Propriété 1. La fonction de distribution est une fonction non négative comprise entre zéro et un :

La validité de cette propriété découle du fait que la fonction de distribution est définie comme la probabilité d'un événement aléatoire consistant dans le fait que.

Propriété 2. La probabilité qu'une variable aléatoire tombe dans un intervalle est égale à la différence entre les valeurs de la fonction de distribution aux extrémités de cet intervalle, c'est-à-dire

Il s’ensuit que la probabilité d’une valeur individuelle d’une variable aléatoire continue est nulle.

Propriété 3. La fonction de distribution d'une variable aléatoire est une fonction non décroissante, c'est-à-dire lorsque .

Propriété 4. À moins l'infini, la fonction de distribution est nulle et à plus l'infini, la fonction de distribution est un, c'est-à-dire.

Exemple 1. La fonction de distribution d'une variable aléatoire continue est donnée par l'expression

Trouvez le coefficient et tracez un graphique. Déterminez la probabilité qu'une variable aléatoire prenne une valeur sur l'intervalle à la suite de l'expérience.

Solution. Puisque la fonction de distribution d'une variable aléatoire continue est continue, on obtient : . D'ici. Le graphique des fonctions est présenté sur la Fig. 9.

D’après la deuxième propriété de la fonction de distribution, nous avons :

.

4. Densité de distribution de probabilité et ses propriétés.

La fonction de distribution d'une variable aléatoire continue est sa caractéristique probabiliste. Mais il présente l'inconvénient qu'il est difficile d'en juger la nature de la distribution d'une variable aléatoire dans un petit voisinage de l'un ou l'autre point de l'axe numérique. Une idée plus claire de la nature de la distribution d'une variable aléatoire continue est donnée par une fonction appelée densité de distribution de probabilité ou fonction de distribution différentielle d'une variable aléatoire.

Densité de distributionégal à la dérivée de la fonction de distribution, c'est-à-dire

.

La signification de la densité de distribution est qu'elle indique la fréquence à laquelle une variable aléatoire apparaît dans un certain voisinage d'un point lorsque les expériences sont répétées. Une courbe représentant la densité de distribution d'une variable aléatoire est appelée courbe de distribution.

Considérons les propriétés de la densité de distribution.

Propriété 1. La densité de distribution est non négative, c'est-à-dire

Propriété 2. La fonction de distribution d'une variable aléatoire est égale à l'intégrale de la densité dans l'intervalle de à, c'est-à-dire

Pour trouver les fonctions de distribution des variables aléatoires et de leurs variables, il est nécessaire d'étudier toutes les caractéristiques de ce domaine de connaissances. Il y a plusieurs diverses méthodes pour trouver les valeurs en question, y compris le changement variable et la génération de couple. La distribution est un concept basé sur des éléments tels que la dispersion et les variations. Cependant, ils ne caractérisent que l’étendue de la plage de diffusion.

Les fonctions les plus importantes des variables aléatoires sont celles qui sont liées, indépendantes et distribuées de manière identique. Par exemple, si X1 est le poids d'un individu sélectionné au hasard dans la population masculine, X2 est le poids d'un autre, ... et Xn est le poids d'un autre individu de la population masculine, alors nous devons savoir comment fonction aléatoire X est distribué. Dans ce cas, un théorème classique appelé théorème central limite s’applique. Cela nous permet de montrer que pour n grand, la fonction suit des distributions standards.

Fonctions d'une variable aléatoire

Le théorème central limite est destiné à approximer des valeurs discrètes d'intérêt, telles que le binôme et Poisson. Les fonctions de distribution de variables aléatoires sont considérées tout d'abord sur des valeurs simples d'une variable. Par exemple, si X est une variable aléatoire continue qui possède sa propre distribution de probabilité. Ce cas explore comment trouver la fonction de densité Y en utilisant deux différentes approches, à savoir la méthode de répartition fonction et changement de variable. Premièrement, seules les valeurs un à un sont prises en compte. La technique de changement de variable doit alors être modifiée pour trouver sa probabilité. Enfin, vous devez apprendre comment la distribution cumulative peut aider à modéliser des nombres aléatoires qui suivent certains modèles séquentiels.

Méthode de répartition des valeurs considérées

La méthode de distribution de probabilité d'une variable aléatoire est utilisée pour trouver sa densité. Cette méthode calcule la valeur cumulée. Ensuite, en la différenciant, on peut obtenir la densité de probabilité. Maintenant que nous avons la méthode de la fonction de distribution, nous pouvons examiner quelques exemples supplémentaires. Soit X une variable aléatoire continue avec une certaine densité de probabilité.

Quelle est la fonction de densité de probabilité de x2 ? Si vous regardez ou représentez graphiquement la fonction (en haut et à droite) y = x2, vous pouvez remarquer qu'elle augmente X et 0

Dans le dernier exemple, un grand soin a été pris pour indexer les fonctions cumulatives et les densités de probabilité avec X ou Y pour indiquer à quelle variable aléatoire elles appartenaient. Par exemple, en trouvant la fonction de distribution cumulative de Y, nous obtenons X. Si vous avez besoin de trouver la variable aléatoire X et sa densité, il vous suffit de la différencier.

Technique pour changer les variables

Soit X une variable aléatoire continue spécifiée par une fonction de distribution avec un dénominateur commun f (x). Dans ce cas, si vous mettez la valeur de y dans X = v(Y), vous obtiendrez la valeur de x, par exemple v(y). Maintenant, nous devons obtenir la fonction de distribution d'une variable aléatoire continue Y. Où la première et la deuxième égalité découlent de la définition du cumul Y. La troisième égalité est satisfaite car la partie de la fonction pour laquelle u (X) ≤ y est également vrai que X ≤ v (Y ). Et cette dernière est effectuée pour déterminer la probabilité dans une variable aléatoire continue X. Nous devons maintenant prendre la dérivée de FY(y), la fonction de distribution cumulative de Y, pour obtenir la densité de probabilité de Y.

Généralisation pour la fonction de réduction

Soit X une variable aléatoire continue de commun f(x) défini sur c1

Pour résoudre ce problème, des données quantitatives peuvent être collectées et une fonction de distribution cumulative empirique peut être utilisée. Disposer de ces informations et y faire appel nécessite une combinaison de moyennes d'échantillons, d'écarts types, de données médiatiques, etc.

De même, même un modèle probabiliste assez simple peut produire un grand nombre de résultats. Par exemple, si vous lancez une pièce 332 fois. Ensuite, le nombre de résultats obtenus à partir des révolutions est supérieur à celui de Google (10 100) - un nombre, mais pas moins de 100 quintillions de fois supérieur à celui des particules élémentaires de l'univers connu. Il n’y a aucun intérêt à une analyse qui apporte une réponse à tous les résultats possibles. Il faudra un concept plus simple comme le nombre de têtes ou la course la plus longue des queues. Pour se concentrer sur des questions d’intérêt, un résultat spécifique est adopté. La définition dans ce cas est la suivante : une variable aléatoire est une fonction réelle avec un espace de probabilité.

La plage S d’une variable aléatoire est parfois appelée espace d’état. Ainsi, si X est la valeur en question, alors N = X2, exp ↵X, X2 + 1, tan2 X, bXc et ainsi de suite. La dernière d’entre elles, arrondir X au nombre entier le plus proche, est appelée fonction plancher.

Fonctions de distribution

Une fois la fonction de distribution d'intérêt pour la variable aléatoire x déterminée, la question devient généralement : « Quelles sont les chances que X tombe dans un sous-ensemble des valeurs de B ? Par exemple, B = (nombres impairs), B = (supérieur à 1) ou B = (entre 2 et 7) pour indiquer les résultats qui ont X, la valeur de la variable aléatoire, dans le sous-ensemble A. Donc, dans ce qui précède Par exemple, vous pouvez décrire les événements comme suit.

(X est un nombre impair), (X est supérieur à 1) = (X > 1), (X est compris entre 2 et 7) = (2

Variables aléatoires et fonctions de distribution

Ainsi, on peut calculer la probabilité que la fonction de distribution d'une variable aléatoire x prenne des valeurs dans l'intervalle par soustraction. Vous devez penser à inclure ou exclure des points de terminaison.

Nous appellerons discrète une variable aléatoire si elle possède un espace d’états fini ou dénombrable. Ainsi, X est le nombre de faces sur trois lancers indépendants d’une pièce biaisée qui augmente avec la probabilité p. Nous devons trouver la fonction de distribution cumulative d'une variable aléatoire discrète FX pour X. Soit X le nombre de pics dans une collection de trois cartes. Alors Y = X3 via FX. FX commence à 0, se termine à 1 et ne diminue pas à mesure que les valeurs x augmentent. La fonction de distribution FX cumulative d'une variable aléatoire discrète X est constante sauf pour les sauts. Lors du saut, le FX est continu. Vous pouvez prouver l'affirmation sur la continuité correcte de la fonction de distribution à partir de la propriété de probabilité en utilisant la définition. Cela se passe comme ceci : une variable aléatoire constante a un FX cumulatif, qui est différentiable.

Pour montrer comment cela peut se produire, un exemple peut être donné : une cible avec un rayon unitaire. Probablement. la fléchette est uniformément répartie sur la zone spécifiée. Pour certains λ> 0. Ainsi, les fonctions de distribution des variables aléatoires continues augmentent progressivement. FX a les propriétés d'une fonction de distribution.

Un homme attend à un arrêt de bus jusqu'à son arrivée. Ayant décidé lui-même qu'il refuserait lorsque l'attente atteindrait 20 minutes. Ici, vous devez trouver la fonction de distribution cumulée pour T. L'heure à laquelle la personne sera encore à la gare routière ou ne partira pas. Même si la fonction de distribution cumulative est définie pour chaque variable aléatoire. Néanmoins, d'autres caractéristiques seront assez souvent utilisées : la masse pour une variable discrète et la fonction de densité de distribution d'une variable aléatoire. Habituellement, la valeur est affichée en utilisant l'une de ces deux valeurs.

Fonctions de masse

Ces valeurs sont prises en compte par les propriétés suivantes, qui sont de nature générale (de masse). La première repose sur le fait que les probabilités ne sont pas négatives. La seconde découle de l'observation que l'ensemble pour tout x=2S, l'espace d'états de X, forme une partition de la liberté probabiliste de X. Exemple : tirages à pile ou face biaisés dont les résultats sont indépendants. Vous pouvez continuer à effectuer certaines actions jusqu'à ce que vous obteniez une chance de marquer des buts. Soit X la variable aléatoire qui donne le nombre de queues avant la première tête. Et p désigne la probabilité d'une action donnée.

Ainsi, la fonction de probabilité de masse présente les caractéristiques suivantes. Puisque les termes forment une séquence numérique, X est appelé une variable aléatoire géométrique. Schéma géométrique c, cr, cr2,. , crn a une somme. Et donc sn a une limite quand n 1. Dans ce cas, la somme infinie est la limite.

La fonction de masse ci-dessus forme une séquence géométrique avec le rapport. Il existe donc des nombres naturels a et b. La différence de valeurs dans la fonction de distribution est égale à la valeur de la fonction de masse.

Les valeurs de densité considérées ont la définition suivante : X est une variable aléatoire dont la distribution FX a une dérivée. FX satisfaisant Z xFX (x) = fX (t) dt-1 est appelé fonction de densité de probabilité. Et X est appelé une variable aléatoire continue. Dans le théorème fondamental du calcul, la fonction de densité est la dérivée de la distribution. Vous pouvez calculer des probabilités en calculant des intégrales définies.

Étant donné que les données sont collectées à partir de plusieurs observations, plusieurs variables aléatoires doivent être prises en compte à la fois pour modéliser les procédures expérimentales. Par conséquent, l'ensemble de ces valeurs et leur distribution conjointe pour deux variables X1 et X2 impliquent la visualisation des événements. Pour les variables aléatoires discrètes, des fonctions de masse probabilistes conjointes sont déterminées. Pour les continus, fX1, X2 sont pris en compte, où la densité de probabilité conjointe est satisfaite.

Variables aléatoires indépendantes

Deux variables aléatoires X1 et X2 sont indépendantes si deux événements qui leur sont associés sont identiques. En d'autres termes, la probabilité que deux événements (X1 2 B1) et (X2 2 B2) se produisent simultanément, y, est égale au produit des variables ci-dessus pour que chacun d'eux se produise individuellement. Pour les variables aléatoires discrètes indépendantes, il existe une fonction de masse probabiliste conjointe, qui est le produit du volume ionique limite. Pour les variables aléatoires continues indépendantes, la fonction de densité de probabilité conjointe est le produit des valeurs de densité marginale. Enfin, n observations indépendantes x1, x2 sont considérées. , xn résultant d'une densité ou d'une fonction de masse f inconnue. Par exemple, un paramètre inconnu dans les fonctions d'une variable aléatoire exponentielle décrivant le temps d'attente d'un bus.

Simulation de variables aléatoires

L'objectif principal de ce domaine théorique est de fournir les outils nécessaires pour développer des procédures d'inférence basées sur des principes solides de la science statistique. Ainsi, une application très importante du logiciel est la capacité de générer des pseudo-données pour simuler des informations réelles. Cela permet de tester et d’améliorer les méthodes d’analyse avant de les utiliser dans des bases de données réelles. Ceci est nécessaire pour explorer les propriétés des données grâce à la modélisation. Pour de nombreuses familles de variables aléatoires couramment utilisées, R fournit des commandes pour les créer. Dans d’autres circonstances, des méthodes de modélisation d’une séquence de variables aléatoires indépendantes ayant une distribution commune seront nécessaires.

Variables aléatoires discrètes et modèle de commande. La commande sample est utilisée pour créer des échantillons aléatoires simples et stratifiés. En conséquence, étant donné une séquence x, sample(x, 40) sélectionne 40 entrées parmi x de telle sorte que toutes les options de taille 40 aient une probabilité égale. Cela utilise la commande R par défaut pour sélectionner sans remplacement. Peut également être utilisé pour modéliser des variables aléatoires discrètes. Pour ce faire, vous devez fournir un espace d'état dans le vecteur x et la fonction de masse f. L’appel de replace = TRUE indique que l’échantillonnage se produit avec le remplacement. Ensuite, pour donner un échantillon de n variables aléatoires indépendantes qui ont une fonction de masse f commune, l'échantillon (x, n, replace = TRUE, prob = f) est utilisé.

On détermine que 1 est la plus petite valeur représentée et 4 est la plus grande de toutes. Si la commande prob = f est omise, alors l'échantillon sera échantillonné uniformément à partir des valeurs du vecteur x. Vous pouvez vérifier la simulation par rapport à la fonction de masse qui a généré les données en notant le double signe égal, ==. Et en comptant les observations qui prennent toutes les valeurs possibles pour x. Vous pouvez faire un tableau. Répétez cette opération pour 1 000 et comparez la simulation avec la fonction de masse correspondante.

Illustrer la transformation de probabilité

Tout d’abord, simulez les fonctions de distribution homogènes des variables aléatoires u1, u2,. , un sur l'intervalle . Environ 10 % des nombres devraient être compris entre . Cela correspond à 10 % des simulations par intervalle pour la variable aléatoire avec la fonction de distribution FX affichée. De même, environ 10 % des nombres aléatoires devraient être compris dans la plage . Cela correspond à 10% des simulations sur l'intervalle variable aléatoire avec la fonction de distribution FX. Ces valeurs sur l'axe des x peuvent être obtenues en prenant l'inverse de FX. Si X est une variable aléatoire continue de densité fX positive partout dans son domaine, alors la fonction de distribution est strictement croissante. Dans ce cas, FX a la fonction inverse de FX-1, connue sous le nom de fonction quantile. FX (x) u seulement si x FX-1 (u). La transformation de probabilité découle de l'analyse de la variable aléatoire U = FX (X).

FX a une plage de 0 à 1. Il ne peut pas prendre de valeurs inférieures à 0 ou supérieures à 1. Pour des valeurs de u comprises entre 0 et 1. Si U peut être modélisé, alors il faut simuler une variable aléatoire avec la distribution des FX via une fonction quantile. Prenez la dérivée pour voir que la densité u varie dans la limite de 1. Puisque la variable aléatoire U a une densité constante sur l'intervalle de ses valeurs possibles, elle est dite uniforme sur l'intervalle. Il est modélisé en R à l'aide de la commande runif. L'identité est appelée une transformation probabiliste. Vous pouvez voir comment cela fonctionne dans l’exemple avec le jeu de fléchettes. X entre 0 et 1, la fonction de distribution est u = FX (x) = x2, et donc la fonction quantile est x = FX-1 (u). Il est possible de simuler des observations indépendantes de la distance depuis le centre du panneau de fléchettes, tout en générant des variables aléatoires uniformes U1, U2,. ,ONU. La fonction de distribution et la fonction empirique sont basées sur 100 simulations de la distribution du jeu de fléchettes. Pour une variable aléatoire exponentielle, vraisemblablement u = FX(x) = 1 - exp(- x), et donc x = - 1 ln(1 - u). Parfois, la logique consiste en des déclarations équivalentes. Dans ce cas, vous devez combiner les deux parties de l’argumentation. L'identité avec intersection est similaire pour tous les 2 (S i i) S, au lieu d'une certaine valeur. L’union Ci est égale à l’espace d’états S et chaque paire s’exclut mutuellement. Parce que Bi est divisé en trois axiomes. Chaque test est basé sur la probabilité P correspondante. Pour tout sous-ensemble. Utiliser l'identité pour garantir que la réponse ne dépend pas de l'inclusion ou non des points finaux de l'intervalle.

Fonction exponentielle et ses variables

Pour chaque résultat de tous les événements, la deuxième propriété de continuité des probabilités est finalement utilisée, qui est considérée comme axiomatique. La loi de distribution d'une fonction d'une variable aléatoire montre ici que chacune a sa propre solution et sa propre réponse.

Les définitions de la fonction de distribution d'une variable aléatoire et de la densité de probabilité d'une variable aléatoire continue sont données. Ces concepts sont activement utilisés dans les articles sur les statistiques des sites Web. Des exemples de calcul de la fonction de distribution et de la densité de probabilité à l'aide des fonctions MS EXCEL sont pris en compte..

Introduisons les concepts de base des statistiques, sans lesquels il est impossible d'expliquer des concepts plus complexes.

Population et variable aléatoire

Laissez-nous population(population) de N objets, dont chacun a une certaine valeur d'une caractéristique numérique X.

Un exemple de population générale (GS) est un ensemble de poids de pièces similaires produites par une machine.

Puisqu'en statistique mathématique, toute conclusion est tirée uniquement sur la base des caractéristiques de X (en faisant abstraction des objets eux-mêmes), alors de ce point de vue population représente N nombres parmi lesquels, dans le cas général, il peut y en avoir des identiques.

Dans notre exemple, GS est simplement un tableau numérique de valeurs de poids de pièce. X est le poids d'une des pièces.

Si, à partir d'un GS donné, nous sélectionnons au hasard un objet ayant la caractéristique X, alors la valeur de X est Variable aléatoire. Par définition, tout valeur aléatoire Il a fonction de répartition, qui est généralement noté F(x).

Fonction de distribution

Fonction de distribution probabilités Variable aléatoire X est une fonction F(x) dont la valeur au point x est égale à la probabilité de l'événement X

F(x) = P(X

Expliquons-nous en utilisant notre machine comme exemple. Bien que notre machine soit censée produire un seul type de pièce, il est évident que le poids des pièces produites sera légèrement différent les unes des autres. Ceci est possible car différents matériaux peuvent être utilisés dans la fabrication et les conditions de traitement peuvent également varier légèrement, etc. Supposons que la pièce la plus lourde produite par la machine pèse 200 g et la plus légère 190 g. La probabilité que la pièce X sélectionnée pèse moins de 200 g est égale à 1. La probabilité qu'elle pèse moins de 190 g est égale à 0. Les valeurs intermédiaires sont déterminées par la forme de la fonction de distribution. Par exemple, si le procédé est configuré pour produire des pièces pesant 195 g, alors il est raisonnable de supposer que la probabilité de sélectionner une pièce plus légère que 195 g est de 0,5.

Graphique typique Fonctions de distribution pour une variable aléatoire continue est illustré dans l'image ci-dessous (courbe violette, voir fichier exemple) :

Dans l'aide MS EXCEL Fonction de distribution appelé Intégral fonction de distribution (CumulatifDistributionFonction, CDF).

Voici quelques propriétés Fonctions de répartition :

  • Fonction de distribution F(x) change dans l’intervalle, car ses valeurs sont égales aux probabilités des événements correspondants (par définition, la probabilité peut aller de 0 à 1) ;
  • Fonction de distribution– fonction non décroissante ;
  • La probabilité qu'une variable aléatoire prenne une valeur dans une certaine plage densité de probabilité est égal à 1/(0,5-0)=2. Et pour avec le paramètre lambda=5, valeur densité de probabilité au point x = 0,05 est 3,894. Mais, en même temps, vous pouvez vous assurer que la probabilité sur n’importe quel intervalle sera, comme d’habitude, comprise entre 0 et 1.

    Rappelons que densité de distribution dérive de fonctions de distribution, c'est à dire. la « vitesse » de son évolution : p(x)=(F(x2)-F(x1))/Dx avec Dx tendant vers 0, où Dx=x2-x1. Ceux. le fait que densité de distribution>1 signifie seulement que la fonction de distribution croît assez rapidement (cela est évident dans l'exemple).

    Note: L'aire entièrement contenue sous la courbe entière représentant densité de distribution, est égal à 1.

    Note: Rappelons que la fonction de distribution F(x) est appelée dans les fonctions MS EXCEL fonction de distribution cumulative. Ce terme est présent dans les paramètres de fonction, par exemple NORM.DIST (x; moyenne; standard_deviation; intégral). Si la fonction MS EXCEL doit renvoyer fonction de répartition, alors le paramètre intégral, d.b. réglé sur VRAI. Si vous devez calculer densité de probabilité, alors le paramètre intégral, d.b. MENSONGE.

    Note: Pour distribution discrète La probabilité qu'une variable aléatoire prenne une certaine valeur est aussi souvent appelée densité de probabilité (fonction de masse de probabilité (pmf)). Dans l'aide MS EXCEL densité de probabilité peut même être appelée une « fonction de mesure de probabilité » (voir la fonction BINOM.DIST()).

    Calcul de la densité de probabilité à l'aide des fonctions MS EXCEL

    Il est clair que pour calculer densité de probabilité pour une certaine valeur d'une variable aléatoire, vous devez connaître sa distribution.

    Nous trouverons densité de probabilité pour N(0;1) à x=2. Pour ce faire, vous devez écrire la formule =NORMAL.ST.DIST(2,FALSE)=0,054 ou =NORMAL.DIST(2,0,1,FALSE).

    Rappelons que probabilité que variable aléatoire continue prendra une valeur spécifique x est 0. Pour variable aléatoire continue X ne peut être calculé que par la probabilité de l'événement que X prendra la valeur contenue dans l'intervalle (a; b).

    Calcul de probabilités à l'aide des fonctions MS EXCEL

    1) Trouvons la probabilité qu'une variable aléatoire distribuée par (voir l'image ci-dessus) prenne une valeur positive. Selon la propriété Fonctions de distribution la probabilité est F(+∞)-F(0)=1-0,5=0,5.

    DIST.ST.NORM(9.999E+307,VRAI) -DIST.ST.NORM(0,VRAI) =1-0,5.
    Au lieu de +∞, la valeur saisie dans la formule est 9,999E+307= 9,999*10^307, qui est le nombre maximum pouvant être saisi dans une cellule MS EXCEL (le plus proche de +∞, pour ainsi dire).

    2) Trouvez la probabilité qu'une variable aléatoire distribuée sur , a pris une valeur négative. D'après la définition Fonctions de distribution la probabilité est F(0)=0,5.

    Dans MS EXCEL, pour trouver cette probabilité, utilisez la formule =NORMAL.ST.DIST(0,VRAI) =0,5.

    3) Trouvez la probabilité qu'une variable aléatoire distribuée sur distribution normale standard, prendra la valeur contenue dans l’intervalle (0 ; 1). La probabilité est égale à F(1)-F(0), c'est-à-dire de la probabilité de choisir X dans l'intervalle (-∞;1), vous devez soustraire la probabilité de choisir X dans l'intervalle (-∞;0). Dans MS EXCEL, utilisez la formule =DIST.ST.NORM(1,VRAI) - DIST.ST.NORM(0,VRAI).

    Tous les calculs donnés ci-dessus se réfèrent à une variable aléatoire répartie sur loi normale standard N(0;1). Il est clair que les valeurs de probabilité dépendent d'une distribution spécifique. Dans l'article, trouvez le point pour lequel F(x) = 0,5, puis trouvez l'abscisse de ce point. Abscisse du point =0, soit la probabilité que la variable aléatoire X prenne la valeur<0, равна 0,5.

    Dans MS EXCEL, utilisez la formule =NORM.ST.REV(0.5) =0.

    Calculer sans ambiguïté la valeur Variable aléatoire permet la propriété de monotonie fonctions de répartition.

    Fonction de distribution inverse calcule , qui sont utilisés, par exemple, lorsque . Ceux. dans notre cas, le nombre 0 est le quantile 0,5 distribution normale. Dans le fichier d'exemple, vous pouvez calculer un autre quantile cette répartition. Par exemple, le quantile 0,8 est 0,84.

    Dans la littérature anglaise fonction de distribution inverse souvent appelée fonction de point de pourcentage (PPF).

    Note: Lors du calcul quantile dans MS EXCEL, les fonctions suivantes sont utilisées : NORM.ST.INV(), LOGNORM.INV(), CHI2.INR(), GAMMA.INR(), etc. Vous pouvez en savoir plus sur les distributions présentées dans MS EXCEL dans l'article.

    Le contenu de l'article

    FONCTION DE RÉPARTITION– densité de probabilité de distribution des particules d'un système macroscopique sur des coordonnées, des impulsions ou des états quantiques. La fonction de distribution est la caractéristique principale d'une grande variété de systèmes (pas seulement physiques) caractérisés par un comportement aléatoire, c'est-à-dire changement aléatoire de l'état du système et, par conséquent, de ses paramètres. Même dans des conditions externes stationnaires, l'état du système lui-même peut être tel que le résultat de la mesure de certains de ses paramètres est une variable aléatoire. Dans la grande majorité des cas, la fonction de distribution contient toutes les informations possibles et donc complètes sur les propriétés de tels systèmes.

    Dans la théorie mathématique des probabilités et les statistiques mathématiques, la fonction de distribution et la densité de probabilité diffèrent l'une de l'autre, mais sont clairement liées les unes aux autres. Ci-dessous, nous parlerons presque exclusivement de la densité de probabilité, qui (selon une longue tradition en physique) est appelée densité de distribution de probabilité ou fonction de distribution, en mettant un signe égal entre ces deux termes.

    Le comportement aléatoire est, à un degré ou à un autre, caractéristique de tous les systèmes de mécanique quantique : particules élémentaires, atomes d'une molécule, etc. Cependant, le comportement aléatoire n’est pas seulement une caractéristique spécifique des systèmes de mécanique quantique ; de nombreux systèmes purement classiques possèdent cette propriété.

    Exemples.

    Lorsque l’on lance une pièce sur une surface horizontale dure, il n’est pas clair si elle atterrira avec le numéro vers le haut ou avec les armoiries. On sait que les probabilités de ces événements, sous certaines conditions, sont égales à 1/2. Lorsque vous lancez un dé, vous ne pouvez pas dire avec certitude lequel des six chiffres figurera sur la face supérieure. La probabilité que chaque nombre tombe sous certaines hypothèses (le dé est un cube homogène sans bords ébréchés et ses sommets tombe sur une surface horizontale dure et lisse) est de 1/6.

    Le caractère aléatoire du mouvement moléculaire est plus prononcé dans les gaz. Même dans des conditions externes stationnaires, les valeurs exactes des paramètres macroscopiques fluctuent (changent de manière aléatoire) et seules leurs valeurs moyennes sont constantes. La description des systèmes macroscopiques dans le langage des valeurs moyennes des macroparamètres est l'essence de la description thermodynamique ().

    Soit un gaz monoatomique idéal et trois de ses paramètres macroscopiques (pas encore moyennés) : N– le nombre d'atomes se déplaçant à l'intérieur d'un récipient occupé par du gaz ; P. est la pression du gaz sur la paroi du récipient et est l'énergie interne du gaz. Le gaz est idéal et monoatomique, donc son énergie interne est simplement la somme des énergies cinétiques du mouvement de translation des atomes de gaz.

    Nombre N fluctue, au moins, en raison du processus de sorption (collage à la paroi d'un récipient lors d'un impact avec celui-ci) et de désorption (processus de décollement, lorsqu'une molécule se détache de la paroi d'elle-même ou à la suite d'un choc avec une autre molécule). ), et enfin, le processus de formation de clusters – des complexes de courte durée de plusieurs molécules. S'il était possible de mesurer N instantanément et avec précision, puis la dépendance qui en résulte N(t) serait similaire à celui montré sur la figure.

    La plage de fluctuations de la figure est largement surestimée pour des raisons de clarté, mais avec une petite valeur moyenne (b N avec ~ 10 2) le nombre de particules dans le gaz, ce sera approximativement le même.

    Si vous sélectionnez une petite zone sur la paroi d'un récipient et mesurez la force agissant sur cette zone à la suite des impacts de molécules de gaz situées dans le récipient, alors le rapport de la valeur moyenne de la composante de cette force normale à la surface à la zone de la zone est généralement appelée pression. À différents moments, différents nombres de molécules voleront vers le site et à différentes vitesses. En conséquence, s'il était possible de mesurer cette force instantanément et avec précision, il y aurait une image similaire à celle montrée sur la figure, il suffit de changer la notation le long de l'axe vertical :

    N(t) YU P.(t) et B N(t)s Yub P.(t)Avec.

    Il en va presque de même pour l’énergie interne d’un gaz, seuls les processus conduisant à des changements aléatoires de cette quantité sont différents. Par exemple, en s'approchant de la paroi d'un récipient, une molécule de gaz n'entre pas en collision avec une paroi abstraite, absolument élastique et spéculairement réfléchissante, mais avec l'une des particules qui composent le matériau de cette paroi. Supposons que le mur soit en acier, ce sont alors des ions de fer oscillant autour de positions d'équilibre - les nœuds du réseau cristallin. Si une molécule de gaz s'approche de la paroi à cette phase des oscillations de l'ion lorsqu'elle se dirige vers elle, alors à la suite de la collision, la molécule s'éloignera de la paroi à une vitesse supérieure à celle à laquelle elle s'approchait. Parallèlement à l'énergie de cette molécule, l'énergie interne du gaz augmentera également E. Si une molécule entre en collision avec un ion se déplaçant dans la même direction qu'elle, alors cette molécule s'envolera à une vitesse inférieure à celle avec laquelle elle a volé. Enfin, une molécule peut pénétrer dans un espace interstitiel (un espace vide entre les nœuds adjacents d'un réseau cristallin) et s'y coincer, de sorte que même un fort chauffage ne peut pas l'en retirer. Dans les deux derniers cas, l'énergie interne du gaz E diminuera. Ainsi, E(t) est également une fonction aléatoire du temps et est la valeur moyenne de cette fonction.

    Mouvement brownien.

    Après avoir déterminé la position d'une particule brownienne à un moment donné t 1, on peut prédire avec précision seulement que sa position à un moment ultérieur t 2 ne dépasse pas ( t 2 –t 1)· c, Où c– vitesse de la lumière dans le vide.

    Il existe des cas de spectre d'états discret et continu et, par conséquent, variable X. Le spectre des valeurs d'une variable s'entend comme l'ensemble de ses valeurs possibles.

    Dans le cas d'un spectre discret d'états, pour spécifier une distribution de probabilité, il faut, dans un premier temps, indiquer l'ensemble complet des valeurs possibles de la variable aléatoire

    X 1, X 2, X 3,…X k,… (1)

    et deuxièmement, leurs probabilités :

    W 1, W 2, W 3,…W k,… (2)

    La somme des probabilités de tous les événements possibles doit être égale à un (condition de normalisation)

    La description de la distribution de probabilité par les relations (1) – (3) est impossible dans le cas d'un spectre continu d'états et, par conséquent, d'un spectre continu de valeurs possibles de la variable X. Laisser X accepte toutes les valeurs réelles possibles dans l'intervalle

    XÀ PROPOS DE [ un, b] (4)

    un Et b pas nécessairement fini. Par exemple, pour le module du vecteur vitesse d'une molécule de gaz V O se situant dans toute la plage des valeurs possibles, c'est-à-dire XÀ PROPOS DE [ X,X+D X] À PROPOS DE [ un, b] (5)

    Alors probabilité D W(X, D X) les coups X dans l'intervalle (5) est égal à

    Ici N– nombre total de mesures X, et D n(X, D X) – nombre de résultats tombant dans l’intervalle (5).

    Probabilité D W dépend naturellement de deux arguments : X– position de l’intervalle à l’intérieur de [ un, b] et D X– sa longueur (on suppose, bien que ce ne soit pas du tout nécessaire, que D X> 0). Par exemple, la probabilité d'obtenir la valeur exacte X, en d'autres termes, la probabilité de toucher X dans un intervalle de longueur nulle il existe une probabilité d'un événement impossible et donc égale à zéro : D W(X, 0) = 0

    En revanche, la probabilité d'obtenir la valeur X quelque part (peu importe où) dans tout l'intervalle [ un, b] est la probabilité d'un événement fiable (quelque chose se produit toujours) et est donc égale à un (on suppose que b > un): D W(un, bun) = 1.

    Soit D X peu. Le critère de petitesse suffisante dépend des propriétés spécifiques du système, qui sont décrites par la distribution de probabilité D W(X, D X). Si D X est petit, alors la fonction D W(X, D X) peut être développé en une série en puissances de D X:

    Si vous dessinez un graphique de D W(X, D X) à partir du deuxième argument D X, alors remplacer la dépendance exacte par une expression approximative (7) signifie remplacer (dans une petite zone) la courbe exacte par un morceau de parabole (7).

    Dans (7) le premier terme est exactement égal à zéro, le troisième terme et les suivants lorsque D est suffisamment petit X peut être omis. Introduction à la notation

    donne un résultat important D W(X, D X) » r( X)·D X (8)

    Relation (8), qui est remplie avec plus de précision, plus D est petit X signifie que si la longueur de l’intervalle est courte, la probabilité de tomber dans cet intervalle est proportionnelle à sa longueur.

    Vous pouvez également passer d'un D petit mais fini X au formellement infinitésimal dx, avec remplacement simultané de D W(X, D X) sur dW(X). Alors l'égalité approximative (8) se transforme en exacte dW(X) = r( Xdx(9)

    Facteur de proportionnalité r( X) a une signification simple. Comme le montrent (8) et (9), r( X) est numériquement égal à la probabilité de toucher X dans un intervalle de longueur unitaire. Par conséquent, l'un des noms de la fonction r( X) – densité de distribution de probabilité pour la variable X.

    Fonction r( X) contient toutes les informations sur la façon dont la probabilité dW(X) les coups X dans un intervalle d'une longueur donnée dx dépend de l'emplacement de cet intervalle, c'est-à-dire il montre comment la probabilité est répartie sur X. Donc la fonction r( X) est généralement appelée fonction de distribution de la variable X et, donc, la fonction de distribution du système physique dans le but de décrire le spectre d'états dans lequel la variable a été introduite. X. Les termes « densité de probabilité » et « fonction de distribution » sont utilisés de manière interchangeable en physique statistique.

    On peut envisager de généraliser la définition de la probabilité (6) et de la fonction de distribution (9) au cas, par exemple, de trois variables. La généralisation au cas d’un nombre arbitrairement grand de variables s’effectue exactement de la même manière.

    Laissez l'état d'un système physique changeant de manière aléatoire au fil du temps être déterminé par les valeurs de trois variables X, oui Et zà spectre continu :

    XÀ PROPOS DE [ un, b]

    ouiÀ PROPOS DE [ c, d]

    zÀ PROPOS DE [ e, F] (10)

    un, b,…, F, comme auparavant, ne sont pas nécessairement finis. Variables X, oui Et z peut être, par exemple, les coordonnées du centre de masse d'une molécule de gaz, les composantes de son vecteur vitesse X YU Vx, oui YU V y Et z YU Vz ou impulsion, etc. Un événement est compris comme l'apparition simultanée des trois variables dans des intervalles de longueur D X, D oui et D z en conséquence, c'est-à-dire :

    XÀ PROPOS DE [ X, X+D X]

    ouiÀ PROPOS DE [ oui, oui+D oui]

    zÀ PROPOS DE [ z, z+D z] (11)

    La probabilité de l'événement (11) peut être déterminée de la même manière que (6)

    à la différence que maintenant D n– nombre de mesures X, oui Et z, dont les résultats satisfont simultanément les relations (11). L’utilisation d’un développement en série similaire à (7) donne

    dW(X, oui, z) = r( X, oui, zdx dy dz(13)

    où r( X, oui, z) – fonction de distribution pour trois variables à la fois X, oui Et z.

    Dans la théorie mathématique des probabilités, le terme « fonction de distribution » est utilisé pour désigner une quantité différente de r( X), à savoir : soit x une valeur d'une variable aléatoire X. Fonction Ф(x), donnant la probabilité que X prendra une valeur non supérieure à x et est appelée fonction de distribution. Les fonctions r et Ф ont des significations différentes, mais elles sont liées. En utilisant le théorème d’addition de probabilité donne (ici UN– extrémité gauche de la plage des valeurs possibles X (cm. THÉORIE DES PROBABILITÉS) : , (14) d'où

    En utilisant la relation approchée (8), on obtient D W(X, D X) » r( X)·D X.

    La comparaison avec l'expression exacte (15) montre qu'utiliser (8) équivaut à remplacer l'intégrale incluse dans (16) par le produit de la fonction intégrande r( X) par la longueur de l'intervalle d'intégration D X:

    La relation (17) sera exacte si r = const, par conséquent, l'erreur lors du remplacement de (16) par (17) sera faible lorsque la fonction intégrale change légèrement sur la longueur de l'intervalle d'intégration D X.

    Vous pouvez saisir D x eff– longueur de l'intervalle sur lequel la fonction de distribution r( X) change de manière significative, c'est-à-dire par une valeur de l'ordre de la fonction elle-même, ou la valeur de Dr eff ordre modulo r. En utilisant la formule de Lagrange, on peut écrire :

    d'où il s'ensuit que D x eff pour toute fonction r

    La fonction de distribution peut être considérée comme « presque constante » sur un certain intervalle de changement de l'argument si son incrément |Dr| sur cet intervalle, le module est bien inférieur à la fonction elle-même aux points de cet intervalle. Exigence |Dr| eff| ~ r (fonction de distribution r i 0) donne

    D X x eff (20)

    la longueur de l'intervalle d'intégration doit être petite par rapport à celle sur laquelle la fonction intégrande change de manière significative. L'illustration est présentée sur la Fig. 1.

    L'intégrale du côté gauche de (17) est égale à l'aire sous la courbe. Le produit du côté droit de (17) est la zone ombrée sur la figure. 1 colonne. Le critère de petitesse de la différence entre les zones correspondantes est la réalisation de l'inégalité (20). Cela peut être vérifié en substituant les premiers termes du développement de la fonction r( X) par ordre de pouvoirs

    L'exigence que la correction (le deuxième terme du côté droit de (21)) soit petite par rapport au premier donne l'inégalité (20) avec D x eff de (19).

    Exemples d'un certain nombre de fonctions de distribution qui jouent un rôle important en physique statistique.

    Distribution de Maxwell pour la projection du vecteur vitesse moléculaire sur une direction donnée (par exemple, c'est la direction de l'axe BŒUF).

    Ici m– masse d'une molécule de gaz, T– sa température, k– Constante de Boltzmann.

    Distribution de Maxwell pour l'amplitude du vecteur vitesse :

    Distribution de Maxwell pour l'énergie du mouvement de translation des molécules e = mV 2/2

    Distribution de Boltzmann, plus précisément, la formule dite barométrique, qui détermine la répartition de la concentration de molécules ou de la pression atmosphérique en altitude hà partir d’un « niveau zéro » en supposant que la température de l’air ne dépend pas de l’altitude (modèle d’atmosphère isotherme). En fait, la température dans la basse atmosphère diminue sensiblement avec l’augmentation de l’altitude.