Bonjour, Habr!
L'équipe Datalore by JetBrains est en contact . Nous aimerions partager avec vous les résultats de l'analyse de plusieurs millions de référentiels Github accessibles au public avec les notebooks Jupyter. Nous avons téléchargé des ordinateurs portables pour obtenir un aperçu un peu plus numérique de l'état actuel de l'outil de science des données le plus populaire.
Inspirés par les recherches de l'équipe Design Lab de l'UC San Diego, nous avons téléchargé deux fois les ordinateurs portables Jupyter, en octobre 2019 et en octobre 2020.
Il y a deux ans, 1,23 million d'ordinateurs portables étaient dans le domaine public. En octobre 2020, le nombre d'ordinateurs portables a été multiplié par 8 et nous avons pu télécharger 9,72 millions de fichiers. Nous avons rendu cet ensemble de données public - les instructions de téléchargement se trouvent à la fin de l'article.
Datalore . Datalore — Jupyter- , JetBrains. , , Datalore.
, . , @JBDatalore contact@datalore.jetbrains.com.
.
data science
R Julia , Python Jupyter-.
, Bash, MatLab Scilab, , , , : Scala, C++ Java.
. , , “nan”.
Python 2 Python 3 2018, 2019 2020 .
|
Python 2 |
Python 3 |
Other languages |
2018 |
52,5% |
43,8% |
3,7% |
2019 (JetBrains Datalore) |
18,1% ( 1029 K) |
72,6% ( 4128 K) |
9,3% ( 529 K) |
2020 (JetBrains Datalore) |
11,8% ( 1154 K, +125 K 2019) |
79,3% ( 7710 K, +3582 K 2019) |
10,8% ( 1050 K, +521 K 2019) |
, Python 3, 2019 87%, Python 2 — 12%.
, Python R, :
data science
Datalore , Python-. Jupyter-.
, 60% Numpy, 47% Pandas Matplotlib.
:
:
PyTorch TensorFlow
, PyTorch TensorFlow.
, PyTorch , TensorFlow.
, Keras TensorFlow , Fast.ai PyTorch . , TensorFlow, , , , .
|
TensorFlow |
Keras |
PyTorch |
Fastai |
2019 (JetBrains Datalore) |
321 K |
231 K |
110 K |
19 K |
2020 (JetBrains Datalore) |
430 K (+34%) |
367 K(+59%) |
253 K(+130%) |
25 K(+32%) |
( , Python 3.6 ):
71,90% Markdown.
42,13% output.
12,34% LaTex.
19,77% HTML.
20,63% Markdown.
Markdown Jupyter-. 50% 4 Markdown 14 .
Markdown- :
. , 25 000 , 95% 465 :
. , 42% . 10% 8 .
Jupyter-
Jupyter- — . , . Jupyter- , 36% Jupyter- , . . .
, Markdown- . , , , , , .
Jupyter- , data science.
, . , , Datalore-.
:
:
(3 ). Datalore-.