Fixer des graines dans R

Fixer des graines dans R
«Dans R, vous construisez des nombres de pseudorandoms au lieu de« nombres aléatoires."Ces chiffres sont créés à l'aide d'un algorithme qui commence par une graine. Parce qu'il est pseudorandom plutôt que pur aléatoire, le résultat peut être prédit (et reproduit) si la graine et le générateur sont connus. Dans ce tutoriel, vous apprendrez ce que signifie définir une graine et quel ensemble.La fonction de semence fait en r et comment régler.La fonction des semences fonctionne, comment définir ou décrocher une graine, et aussi comment produire des sorties reproductibles en conséquence.

Le but de Set.La fonction semence () est de s'assurer que les résultats de randomisation sont cohérents. En raison de la randomisation, lorsque nous choisissons au hasard certaines observations pour toute activité dans R ou tout logiciel statistique, nous obtenons des valeurs différentes à chaque fois. Si nous souhaitons maintenir les valeurs générées par le choix aléatoire initial, après randomisation, nous pouvons soit préserver les résultats dans un objet ou modifier le mécanisme de randomisation afin que nous obtenions toujours les mêmes résultats."

Quel est l'ensemble.tâche de semence () dans le r in ubuntu 20.04?

Vous devez d'abord établir une graine avant de pouvoir utiliser R pour initialiser un générateur de nombres pseudo-aléatoires. La capacité de générer des entiers pseudo-aléatoires qui reproduisent les attributs des générations indépendantes uniformément réparties dans l'intervalle (0, 1) est requise par la majorité des outils de simulation en statistiques (0,1). Un algorithme récursif appelé générateur de nombres aléatoires (RNG) est nécessaire pour générer ces séquences de nombres pseudorandoms:

xi = f (xi - 1, xi - 2,…, xi - k)

Où (x0, x1,2,…, xk-1) est la graine ou l'état initial du générateur, et k est l'ordre du générateur. La fonction rngkind ou le type de paramètre de l'ensemble.La fonction de semence dans R, qui utilise le générateur Mersenne-Twister par défaut, peut être utilisée pour sélectionner parmi une variété de générateurs. La syntaxe que nous utilisons pour l'ensemble.La fonction des semences dans le langage R est démontrée comme suit:

Syntaxe:

ensemble.graine (n)

Lorsque n est désigné comme un numéro entier qui sert de graine, la valeur des semences (n) que vous sélectionnez sera utilisée comme point de départ pour générer une série de nombres aléatoires. En conséquence, avec le même numéro de semence, vous obtiendrez les mêmes résultats.

Comment faire l'ensemble.Fonction des semences fonctionne dans le r dans Ubuntu 20.04?

Regardons un exemple de la façon d'utiliser le jeu de R.Méthode Seed () pour générer un échantillon cohérent de nombres aléatoires. L'ensemble d'un cadre de données.La méthode semence () est également représentée comme un exemple.

Exemple n ° 1: en utilisant l'ensemble.Fonction des semences pour les valeurs aléatoires en r dans Ubuntu 20.04

Lorsque vous utilisez l'ensemble de nombres pseudorandom.Fonction de semence, vous obtiendrez un résultat différent chaque fois que vous les exécutez.

Premièrement, nous avons montré les nombres aléatoires générés sans l'ensemble.fonction de semence. R a une fonction intégrée appelée rnorm qui crée un vecteur de nombres aléatoires correctement distribués. À l'intérieur de la fonction RNorm, nous avons passé la valeur numérique 3, qui, lors de l'exécution, montre les trois valeurs aléatoires. Cependant, si vous exécutez à nouveau le code précédent, le résultat est distinct. Parce que vous ne connaissez pas la graine R utilisée pour construire cette séquence, cela signifie que le code n'est pas reproductible.

Maintenant, nous avons spécifié un ensemble.Fonction des semences et définissez la valeur à l'intérieur. L'état actuel du générateur de nombres aléatoires est enregistré dans la variable x, où le hasard.les graines sont utilisées. C'est un vecteur entier dont la longueur est déterminée par le générateur. Ensuite, nous avons appelé Rnorm avec la valeur à l'intérieur. Nous avons généré la graine deux fois mais avec le hasard.graine. Il génère donc les différentes valeurs aléatoires à la fois le temps. De plus, nous avons apparié à la fois X et Y pour avoir des valeurs aléatoires identiques, qui renvoient faux car les valeurs aléatoires sont différentes.

Nous pouvons passer n'importe quelle valeur numérique à l'ensemble.fonction de semence. Il génère les valeurs aléatoires comme dans l'écran d'invite R ci-dessus. Nous avons passé des valeurs de degré plus élevées à l'intérieur de la fonction et obtenons les valeurs aléatoires.

Exemple # 2: Utilisation de l'ensemble.Fonction des semences pour un cadre de données d'échantillon aléatoire dans R dans Ubuntu 20.04

Regardons un exemple de l'ensemble d'un cadre de données.Fonction Seed () Extraction d'un échantillon de trame de données aléatoire.

Nous avons invoqué l'ensemble.Fonction des semences où la valeur 1234 est passée. Ensuite, nous avons créé une variable qui est représentée comme un index où la fonction d'échantillon prend le cadre de données MTCARS et la valeur 10. Il n'a généré que les dix premières entrées de la sortie.

Ainsi, l'ensemble de données d'échantillon aléatoire est généré à l'aide de l'ensemble.fonction de semence.

Exemple # 3: Utilisation de l'ensemble.Fonction des semences pour calculer la médiane en R dans Ubuntu 20.04

La mise en place d'une graine en R est avantageuse avec des études de simulation, comme nous l'avons déjà dit. Supposons que vous souhaitez trouver la moyenne d'un ensemble de nombres tirés d'une distribution homogène, comme démontré ci-dessous.

Ci-dessus, nous avons spécifié l'ensemble.Fonction des semences avec un entier d'entrée. Ensuite, nous avons créé une variable n_rep et lui avons attribué une valeur à répéter. Il y a une autre variable, n, et définie avec la valeur du nombre de points. La fonction numérique est appliquée à la variable n_rep, puis nous avons une itération sur le numéro de répétition pour les valeurs médianes.

Si vous exécutez le code précédent, vous obtiendrez la sortie suivante:

Exemple n ° 4: Utilisation de l'ensemble.Fonction des semences pour l'instaurer dans R dans Ubuntu 20.04

Enfin, vous voudrez peut-être utiliser R pour réinitialiser ou non une graine. Vous avez deux stratégies pour obtenir ceci.

Étant donné que R utilise l'horloge système pour générer une graine lorsque l'on n'est pas fourni, vous pouvez revenir au comportement par défaut en utilisant le SYS.approche temporelle. D'un autre côté, vous pouvez passer la valeur nul à l'intérieur de l'ensemble.Fonction des semences pour réinitialiser la graine.

Conclusion

Nous pouvons utiliser une graine aléatoire dans R pour nous assurer que le résultat de notre fonction R est reproductible. En spécifiant une graine, les opérations aléatoires de notre programme commencent toujours au même moment et, par conséquent, produisent la même sortie. Nous avons couvert l'ensemble.Fonction des semences dans notre exemple pour différents cas. Tous les exemples sont exécutés dans le terminal Ubuntu et ont des sorties valides.