Bonjour, Habr! En prévision du début du cours "Ecosystem Hadoop, Spark, Hive" nous avons préparé pour vous une traduction d'un article utile. Nous vous proposons également de regarder un enregistrement gratuit d'une leçon de démonstration sur le thème: "Spark 3.0: Quoi de neuf?" ...
(executor) - , (.. ) (node) . , EC2 . r5.4xlarge, , AWS EC2, 16 .
(job), (Cluster Manager). 16 . , Spark , 15 .
, , , , (core) Spark . (X * Y = 15), , , 15 Spark :
.
, , - 15 . , , , , , (64 +), . .
, — 15 , . , , , . , . .
10% 384 MB ( , ). big data , Qubole, , . , «Environments» Spark spark.executor.memoryOverhead
.
Spark , . , , , . , , .
, . Spark , 5 — . , , , . , . , .
--executor-cores 5
— , . , , . , — . , EC2 , , , . r5.4xlarge AWS , 128 .
, 112 .
, 112 , . , 3. .
( Qubole), . (112/3) = 37–2,3 = 34,7 = 34.
Spark , . (112/3) = 37 / 1,1 = 33,6 = 33.
Qubole.
--executor-memory 34G
, Spark . . , Spark Spark. , , , . , , 2, . , , , — , .
, , EC2, . , , .
. , , 5.
, , , . , - , 15 , , , . 3, .
. . , 3, 16- , , 14 . !
, , , 3 , .
--num-executors (3x - 1)
4 , .
data- . AWS , . , .
--driver-memory 34G
, , , . 2 , (3x - 2), .
. , , 500 Spark, , . . , , .
--driver-cores 5
?
, , 16 128 , .
--driver-memory 34G --executor-memory 34G --num-executors (3x - 1) --executor-cores 5
:
— , .
, . . , , , .
, , Expedia Group ™, . , , , .
, , . ? ? , , ? - ? 4: « Apache Spark ».