Dans une série d'articles, je souhaite réfuter les idées fausses associées à la gestion de la mémoire et approfondir sa structure dans certains langages de programmation modernes - Java, Kotlin, Scala, Groovy et Clojure. Espérons que cet article vous aidera à comprendre ce qui se passe sous le capot de ces langues. Tout d'abord, nous examinerons la gestion de la mémoire dans la machine virtuelle Java (JVM) , qui est utilisée dans Java, Kotlin, Scala, Clojure, Groovy et d'autres langages. Dans le premier article, j'ai également couvert la différence entre une pile et un tas, ce qui est utile pour comprendre cet article.

Structure de la mémoire JVM

Examinons d'abord la structure de la mémoire JVM. Cette structure est utilisée depuis le JDK 11 . Voici la mémoire disponible pour le processus JVM, elle est allouée par le système d'exploitation:

Il s'agit de la mémoire native allouée par le système d'exploitation et sa taille dépend du système, du processeur et du JRE. À quels domaines et à quoi sont-ils destinés?

Tas

C'est là que la JVM stocke les objets et les données dynamiques. C'est la plus grande zone de mémoire et c'est là que le garbage collector fonctionne. La taille du tas peut être contrôlée avec les indicateurs Xms

(taille initiale) et Xmx

(taille maximale). Le tas n'est pas transféré vers la machine virtuelle dans son ensemble, une partie est réservée en tant qu'espace virtuel, grâce auquel le tas peut croître à l'avenir. Le tas est divisé en espaces de la «jeune» et de la «vieille» génération.

La jeune génération , ou «nouvel espace»: l'espace dans lequel vivent de nouveaux objets. Il est divisé en Eden Space et Survivor Space. La zone de contrôle de la jeune génération, " le jeune garbage collector " (Minor GC), qui est aussi appelé "le jeune" (Young GC).
- Paradis : C'est là que la mémoire est allouée lorsque nous créons de nouveaux objets.
- Zone de survivant : c'est là que les objets laissés par le ramasse-miettes mineur sont stockés. La zone est divisée en deux moitiés, S0 et S1 .
Ancienne génération , ou «stockage» (Tenured Space): Cela inclut les objets qui ont atteint le seuil de stockage maximal au cours de la vie d'un garbage collector junior. Cet espace est géré par un GC majeur.

Piles de fils

Il s'agit d'une zone de pile dans laquelle une pile est allouée par thread. C'est là que les données statiques spécifiques aux threads sont stockées, y compris les cadres de méthode et de fonction, et les pointeurs vers des objets. La taille de la mémoire de la pile peut être définie à l'aide d'un indicateur Xss

.

Metaspace

Cela fait partie de la mémoire native, par défaut, il n'a pas de limite supérieure. Dans les versions antérieures de la JVM, cette mémoire est appelée espace de génération permanent ( espace permanent de génération (PermGen)) . Les chargeurs de classe y stockaient des définitions de classe. Si cet espace augmente, le système d'exploitation peut déplacer les données stockées ici de la RAM vers la mémoire virtuelle, ce qui peut ralentir l'application. Cela peut être évité en définissant la taille de MetaSpace via des indicateurs XX:MetaspaceSize

et -XX:MaxMetaspaceSize

, dans ce cas, l'application peut émettre une erreur de mémoire.

Cache de code

C'est là que le compilateur Just In Time (JIT) stocke les blocs de code compilés auxquels vous devez accéder fréquemment. Habituellement, la JVM interprète le bytecode en code machine natif, mais le code compilé par le compilateur JIT n'a pas besoin d'être interprété, il est déjà au format natif et mis en cache dans cette zone de mémoire.

Bibliothèques partagées

C'est là que le code natif de toutes les bibliothèques partagées est stocké. Cette zone de mémoire est chargée par le système d'exploitation une seule fois pour chaque processus.

Utilisation de la mémoire JVM: pile et tas

Voyons maintenant comment le programme exécutable utilise les parties les plus importantes de la mémoire. Utilisons le code ci-dessous. Il n'est pas optimisé pour l'exactitude, donc ignorez les problèmes tels que les variables intermédiaires inutiles, les modificateurs incorrects, etc. Son travail est de visualiser l'utilisation de la pile et du tas.

class Employee {
    String name;
    Integer salary;
    Integer sales;
    Integer bonus;

    public Employee(String name, Integer salary, Integer sales) {
        this.name = name;
        this.salary = salary;
        this.sales = sales;
    }
}

public class Test {
    static int BONUS_PERCENTAGE = 10;

    static int getBonusPercentage(int salary) {
        int percentage = salary * BONUS_PERCENTAGE / 100;
        return percentage;
    }

    static int findEmployeeBonus(int salary, int noOfSales) {
        int bonusPercentage = getBonusPercentage(salary);
        int bonus = bonusPercentage * noOfSales;
        return bonus;
    }

    public static void main(String[] args) {
        Employee john = new Employee("John", 5000, 5);
        john.bonus = findEmployeeBonus(john.salary, john.sales);
        System.out.println(john.bonus);
    }
}

Vous pouvez voir ici comment le programme ci-dessus est exécuté et comment la pile et le tas sont utilisés:

https://files.speakerdeck.com/presentations/9780d352c95f4361bd8c6fa164554afc/JVM_memory_use.pdf

Comme vous pouvez le voir:

Chaque appel de fonction est poussé sur le thread de la pile d'exécution en tant que bloc de trame.
Toutes les variables locales, y compris les arguments et les valeurs de retour, sont stockées sur la pile à l'intérieur de blocs de cadre de fonction.
int .
Employee, Integer String , . .
, , .
, .
().
, .

La pile est automatiquement gérée par le système d'exploitation et non par la JVM. Par conséquent, il n'est pas nécessaire de prendre soin de lui. Mais le tas n'est plus géré de cette façon, et comme il s'agit de la plus grande zone de mémoire contenant des données dynamiques, il peut croître de manière exponentielle et le programme peut occuper toute la mémoire au fil du temps. De plus, le tas se fragmente progressivement, ce qui ralentit les performances des applications. La JVM aidera à résoudre ces problèmes. Il gère automatiquement le tas à l'aide du garbage collection.

Gestion de la mémoire JVM: garbage collection

Jetons un coup d'œil à la gestion automatique du tas, qui joue un rôle très important dans les performances des applications. Lorsqu'un programme tente d'allouer plus de mémoire sur le tas que ce qui est disponible (selon la valeur Xmx

), nous sortons des erreurs de mémoire .

La machine virtuelle Java gère le tas à l'aide du garbage collection. Pour faire de la place à la création d'un nouvel objet, la JVM nettoie la mémoire occupée par des objets orphelins, c'est-à-dire des objets qui ne sont plus référencés directement ou indirectement à partir de la pile.

Le garbage collector JVM est responsable de:

Récupération de la mémoire du système d'exploitation et retour au système d'exploitation.
Transfert de la mémoire allouée à l'application à sa demande.
Déterminez quelles parties de la mémoire allouée sont encore utilisées par l'application.
Réclamation de la mémoire inutilisée à utiliser par l'application.

Les garbage collector de la JVM fonctionnent sur une base générationnelle (les objets du tas sont regroupés par âge et nettoyés à différentes étapes). Il existe de nombreux algorithmes de récupération de place, mais Mark & Sweep est le plus couramment utilisé .

Garbage collector Mark & Sweep

La machine virtuelle Java utilise un thread démon distinct qui s'exécute en arrière-plan pour le garbage collection. Ce processus démarre lorsque certaines conditions sont remplies. Le collecteur Mark & Sweep fonctionne généralement en deux étapes, parfois une troisième est ajoutée, en fonction de l'algorithme utilisé.

Balisage : tout d'abord, le collecteur détermine quels objets sont utilisés et lesquels ne le sont pas. Ceux utilisés ou accessibles par les pointeurs de pile sont marqués récursivement comme vivants.
Suppression : le collecteur parcourt le tas et supprime tous les objets qui ne sont pas marqués comme vivants. Ces emplacements de mémoire sont marqués comme libres.
Compression : après avoir supprimé les objets inutilisés, tous les objets survivants sont déplacés de manière à être ensemble. Cela réduit la fragmentation et accélère l'allocation de mémoire pour les nouveaux objets.

Ce type de collecteur est également appelé stop-the-world, car lorsqu'ils sont supprimés, il y a des pauses dans l'application.

La JVM propose plusieurs algorithmes de récupération de place parmi lesquels choisir, et en fonction de votre JDK, il peut y avoir encore plus d'options (par exemple, le collecteur Shenandoah dans OpenJDK). Les auteurs de différentes implémentations visent différents objectifs:

Débit : temps passé sur le garbage collection, sans exécuter l'application. Idéalement, le débit doit être élevé, c'est-à-dire que les pauses de récupération de place sont courtes.
Durée des pauses : durée pendant laquelle le garbage collector interfère avec l'exécution de l'application. Idéalement, les pauses devraient être très courtes.
Taille du tas : devrait idéalement être petite.

Collectionneurs dans JDK 11

JDK 11 est la version LTE actuelle. Vous trouverez ci-dessous une liste des garbage collector disponibles, et la JVM en choisit un par défaut en fonction du matériel et du système d'exploitation actuels. Nous pouvons toujours forcer un sélecteur à être sélectionné à l'aide d'un bouton radio -XX

.

: , , . -XX:+UseSerialGC

.
: , . , / . -XX:+UseParallelGC

.
Garbage-First (G1): ( ). , . . -XX:+UseG1GC

.
Z: , , JDK11. . , stop-the-world. , / ( ). -XX:+UseZGC

.

Quel que soit le collecteur sélectionné, la JVM utilise deux types d'assemblage: le collecteur junior et le collecteur senior.

Assembleur junior

Il maintient la propreté et la compacité de l'espace de la jeune génération. Il est lancé lorsque la JVM ne parvient pas à obtenir la mémoire nécessaire au paradis pour accueillir un nouvel objet. Au départ, toutes les zones du tas sont vides. Le paradis se remplit en premier, suivi de la zone des survivants et à la fin du stockage.

Vous pouvez voir le processus de ce collecteur ici:

https://files.speakerdeck.com/presentations/f4783404769145f4b990154d0cc05629/JVM_minor_GC.pdf

Disons qu'il y a déjà des objets au paradis (les blocs 01 à 06 sont marqués comme étant utilisés).
L'application crée un nouvel objet (07).
JVM , , JVM .
( ), — ().
JVM S0 S1 «» (To Space), S0. «» , , , .
, .
, - , ( 07 13 ).
(14).
JVM , , JVM .
, , « ».
JVM «» S1, S0 «». «» «» (S1), , . , «», , (premature promotion). , .
«» (S0), .
Ceci est répété à chaque session de collectionneur junior, les survivants se déplacent entre S0 et S1, et leur âge augmente. Lorsqu'il atteint le "seuil maximum" spécifié, qui est de 15 par défaut, l'objet est déplacé vers le "stockage".

Nous avons examiné comment le collectionneur junior nettoie la mémoire dans l'espace de la jeune génération. Il s'agit d'un processus d'arrêt du monde, mais il est si rapide que sa durée peut généralement être négligée.

Assembleur senior

Surveille la propreté et la compacité de l'espace de l'ancienne génération (stockage). Fonctionne dans l'une des conditions suivantes:

Le développeur appelle le programme System

. gc()

ou Runtime.getRunTime().gc()

.
La JVM décide que le magasin est à court de mémoire car il est plein à la suite des sessions précédentes du collecteur junior.
Si lors de l'exécution de la JVM collector junior ne peut pas obtenir suffisamment de mémoire dans le paradis ou dans la zone des survivants.
Si nous définissons un paramètre dans la JVM MaxMetaspaceSize

et qu'il n'y a pas assez de mémoire pour charger de nouvelles classes.

Le processus de travail du collectionneur senior est plus simple que celui du junior:

Disons que de nombreuses sessions de collectionneurs juniors sont passées et que le stockage est presque plein. La JVM décide d'exécuter l'ancien collecteur.
Dans le stockage, il parcourt récursivement le graphe d'objets à partir des pointeurs de pile et marque les objets utilisés comme (mémoire utilisée), le reste comme garbage (perdu). Si le collectionneur senior a été lancé pendant le travail du collectionneur junior, alors son travail couvre l'espace de la jeune génération (le paradis et le domaine des survivants) et la voûte.
Le collecteur supprime tous les objets orphelins et récupère la mémoire.
S'il ne reste aucun objet sur le tas pendant le travail de l'ancien collecteur, la JVM récupère également la mémoire de la métaspace, en supprimant les classes chargées, s'il s'agit d'un garbage collection complet.

Conclusion

Nous avons couvert la structure et la gestion de la mémoire de la JVM. Cet article n'est pas exhaustif, nous n'avons pas parlé de nombreux concepts et moyens de personnalisation les plus complexes pour des cas d'utilisation spécifiques. Vous pouvez lire plus de détails ici .

Mais pour la plupart des développeurs JVM (Java, Kotlin, Scala, Clojure, JRuby, Jython), cette quantité d'informations sera suffisante. J'espère que vous pouvez maintenant écrire un meilleur code, créer des applications plus efficaces, en évitant divers problèmes de fuites de mémoire.

Dissiper les mythes sur la gestion de la mémoire dans la JVM

Structure de la mémoire JVM

Tas

Piles de fils

Metaspace

Cache de code

Bibliothèques partagées

Utilisation de la mémoire JVM: pile et tas

Gestion de la mémoire JVM: garbage collection

Garbage collector Mark & Sweep

Collectionneurs dans JDK 11

Assembleur junior

Assembleur senior

Conclusion

Liens

More articles:

Dissiper les mythes sur la gestion de la mémoire dans la JVM

Structure de la mémoire JVM

Tas

Piles de fils

Metaspace

Cache de code

Bibliothèques partagées

Utilisation de la mémoire JVM: pile et tas

Gestion de la mémoire JVM: garbage collection

Garbage collector Mark & ​​Sweep

Collectionneurs dans JDK 11

Assembleur junior

Assembleur senior

Conclusion

Liens

More articles:

Garbage collector Mark & Sweep