Recherche de publications scientifiques sur Internet. Partie 2. Où et comment rechercher

Suite (début - ici )



1.3. Les moteurs de recherche - spécialisés et pas si



En général, les résultats de la recherche dépendent principalement de la tâche et de l'exactitude de la demande. Mais ces résultats sont le plus souvent, d'une part,



a) redondants

et d'autre part, b) incomplets.



Heureusement, les auteurs et les éditeurs, en règle générale, sont intéressés par le fait que les informations sur les publications soient indexées par les moteurs de recherche, mais il y a quelques nuances: l'indexation du contenu des fichiers pdf n'est pas toujours autorisée et, dans certains cas, seuls certains moteurs de recherche sont autorisés à indexer des sites (par exemple, le plus grand la bibliothèque électronique domestique elibrary.ru à un moment donné interdit l'indexation de la plupart des fichiers pour google).



Entre autres choses, les résultats de la requête dépendent de l'ordre des mots et de l'adresse IP à partir de laquelle la recherche est effectuée.



Si nous parlons de recherche de publications, alors la question «quel moteur de recherche utiliser» a une réponse - Google (cela ne compte pas les moteurs de recherche bibliographique spécialisés, à leur sujet ci-dessous).



Premièrement, Google indexe assez complètement le contenu du Web. Deuxièmement, un grand nombre de paramètres de recherche avancés (y compris ceux avec l'utilisation d'opérateurs) facilitent grandement le travail. Troisièmement, comme je l'ai déjà indiqué, le contenu des fichiers pdf est indexé par googl même si le pdf est constitué d'images et que la couche de texte est absente du fichier.







, . Pander, C. H. (1830). Beiträge zur Geognosie des Russischen Reiches. St.Petersburg, Karl Kray. 150 S.







Paramètres de recherche avancés de Google. Sur Yandex, malheureusement, la plupart des paramètres de recherche avancés qui étaient auparavant disponibles ont longtemps disparu, il y a des petites choses comme la recherche par extension de fichier (uniquement à la place du type de fichier de Google: l'opérateur mime est utilisé :)



Pour rechercher des publications, les plus utiles sont les paramètres avancés et les opérateurs qui vous permettent de limiter la recherche aux fichiers un certain format (par exemple, pdf en utilisant filetype: pdf), certains sites / domaines. Par exemple, si j'ai besoin de regarder quels sites chinois ont publié des publications au format pdf, où les ammonites sont mentionnées, alors cette requête aidera: ammonites filetype: pdf site: cn... Eh bien, "+" et "-" sont utilisés pour indiquer des termes obligatoires ou indésirables. Par exemple, lorsque vous recherchez des informations sur les céphalopodes - ammonites, vous n'avez généralement pas besoin d'informations sur l'explosif du même nom ou sur une tribu qui vivait autrefois au Moyen-Orient et est régulièrement mentionnée dans la Bible. En conséquence, la requête peut être corrigée de la manière suivante: ammonites type de fichier: pdf -explosives -Bible

Si vous recherchez une publication spécifique, alors il est souhaitable de mettre une partie de son titre ou tout le titre entre guillemets.



Il est également important que Google ait deux projets distincts directement liés à la recherche de publications:



1) Google livresEst en fait un moteur de recherche distinct qui indexe le contenu d'un grand nombre de livres, magazines, collections et autres publications. Dans le même temps, une partie importante des publications est disponible en téléchargement sous forme de pdf (en règle générale, il s'agit d'éditions anciennes, du début du 20e siècle et plus); selon l'IP, la liste des publications disponibles en téléchargement peut varier considérablement, le nombre maximum d'œuvres est disponible pour les utilisateurs des États-Unis.



Un certain nombre de publications sont disponibles pour consultation en tout ou en partie. Ces œuvres peuvent être téléchargées à l'aide de programmes spéciaux tels que le téléchargeur EDS Google Book ou des plugins (tels que Greasemonkey pour Mozilla combiné à un programme de téléchargement automatique de fichiers tel que Download Master ).



Et, enfin, un bénéfice considérable peut être obtenu même à partir des informations présentes dans les publications qui sont généralement inaccessibles pour être visualisées sous quelque forme que ce soit, à l'exception des fragments sur plusieurs lignes ( vue d'extraits de code ). Cependant, il existe deux difficultés principales avec de telles publications:



a) vous pouvez, bien sûr, essayer de chercher de telles œuvres ailleurs, mais la probabilité qu'elles ne soient disponibles que dans la bibliothèque est assez élevée.



b) il y a beaucoup de confusion dans les noms des sources (en particulier celles qui n'étaient pas initialement données en latin), et les informations affichées sont généralement incomplètes.



Néanmoins, les informations contenues dans de tels fragments peuvent être très importantes et pratiquement inexistantes.







Voici à quoi ressemble une version typique de publication sur Google Books dans le format d'affichage d'extraits de code: en règle générale, une partie des informations bibliographiques nécessaires est manquante (le numéro de numéro de la revue, parfois des parties importantes du nom de la publication). C'est bien si le magazine a 2 numéros par an. Et si 20? Et si le nom est mal orthographié?



2) Google Scholar(Google Academy en russe). Il s'agit d'un moteur de recherche bibliographique qui recherche bien à la fois les articles eux-mêmes et les liens vers eux, tout en vous permettant de copier immédiatement les titres des publications formatées selon les types de citations populaires (APA, Harvard, GOST, etc.). Parmi les avantages de ce système, il y a le fait que non seulement les sites des éditeurs sont indexés, mais aussi les réseaux sociaux spécialisés et une variété de sites où les articles scientifiques sont souvent présentés gratuitement, et tous les liens vers les versions en texte intégral sont regroupés en un seul cluster. Cependant, Google Scholar n'indexe pas toutes les publications - il est facile de vérifier avec la même requête de recherche "mots-clés" filetype: pdfchez Google et Google Scholar. Cette distinction est particulièrement prononcée avec les mots-clés rares.



Eh bien, la fonctionnalité la plus utile de google scholar est la possibilité de s'abonner à une variété de notifications (plus d'informations à ce sujet dans la suite de cet article)







.Exécution de recherches par mots clés sur google scholar. Faites attention aux options de tri, aux options de plage de temps et aux groupes d'articles.



Les moteurs de recherche bibliographique (BPS) orientés vers les publications sont aujourd'hui très diversifiés et nombreux. En plus des projets Google ci-dessus, on peut noter les sites suivants, qui peuvent être considérés comme des BPS:



1) des sites qui indexent un grand nombre de publications à travers le monde. Tout d'abord, c'est Scopus etWeb of Science , disponible sur abonnement (dans le cas de Scopus, l'accès est également fourni aux relecteurs des revues d'Elsevier), ainsi que le plus grand site qui attribue des DOI aux publications ( CrossRef ) ou un agrégateur d'informations sur les publications, les subventions, les chercheurs, etc. Dimensions .



Tous, à l'exception de Dimensions, vous permettent de rechercher des informations sur une quantité limitée de données - il s'agit principalement d'un titre / mots-clés / CV. Pour le pire, CrossRef se démarque ici - là, la recherche ne se fait que par nom, et avec une référence stricte à la forme du mot. Certes, CrossRef a beaucoup plus de publications en langue russe indexées que dans les autres BTS à partir de maintenant, et en plus, c'est le moyen le plus pratique de résoudre un problème tel que «J'ai un nom de publication, j'ai besoin de trouver son DOI» (tous les DOI ne peuvent pas être trouvés comme ça le seul registrateur d'identifiants numériques pour les publications, il y a aussi DataCite, par exemple - mais, curieusement, il n'y a tout simplement pas de service universel pour résoudre un tel problème).





Recherche simple dans les dimensions



Dimensions est un projet très intéressant qui est apparu récemment, principalement en raison d'une variété de paramètres différents, d'une large couverture de publications (seules les publications avec DOI sont indexées, il y en a encore un peu moins que sur CrossRef) et de la recherche en texte intégral. Vous pouvez plutôt sélectionner ici différentes options de recherche (texte intégral / par CV / par titre et mots-clés). Les résultats peuvent être triés de différentes manières (date / pertinence / nombre de liens / nombre d'altmetrics), et limités par différents paramètres (source / auteur / années / sujet et bien plus). Les dimensions ont des versions différentes (y compris payantes et corporate), seule l'option gratuite est considérée ici (nous n'en avons pas encore traité d'autres). Séparément, vous pouvez rechercher des informations à la fois par publications,et sur les bases de données et les subventions (cette dernière option n'est disponible que sur abonnement).







Analytical view , , ( — 2016 2020 ). , , ..



Des options supplémentaires sont proposées dans l'onglet Vue analytique. Ils permettent de comprendre facilement qui est actuellement ou dans une plage de temps choisie est engagé dans un sujet particulier, dans quels magazines ces personnes écrivent des articles et avec quels co-auteurs. C'est un moyen pratique de trouver des co-auteurs et des réviseurs potentiels, en particulier pour ceux qui viennent de commencer à travailler sur un sujet et qui n'ont pas une très bonne idée de ce que l'on en fait à l'échelle mondiale. Pour les chercheurs qui ont un ORCID dans leurs articles, le profil contient à la fois cet identifiant et l'identifiant de l'auteur Scopus, ainsi que (si disponible) le ResearcherID / profil sur Publons qui s'y accroche automatiquement. Je le répète - Dimensions est un projet extrêmement utile et intuitif. Vous pouvez simplement pousser tous les boutons dans une rangée et accéder à tous les onglets.



2) aussi les sites des plus grands éditeurs internationaux (Elsevier, Wiley, Springer, Taylor & Francis, etc.) et distributeurs (Ingentaconnect, GeoscienceWorld) de publications scientifiques peuvent être considérés comme des BTS spécialisés. Cependant, limiter les résultats de la recherche à l'un ou l'autre éditeur ou distributeur n'est généralement pas bénéfique, et peut plutôt être utile pour vous familiariser brièvement avec un sujet particulier.



3) dans une certaine mesure, les fonctions BTS sont assurées par des réseaux sociaux scientifiques ( Academia.edu , ResearchGate ), ainsi qu'un «hybride» d'un réseau social et d'un gestionnaire bibliographique Mendeley (à la fois une version hors ligne en tant que programme et sa version en ligne sont disponibles); de nombreuses options Scopus y sont désormais disponibles après qu'Elsevier a acheté Mendeley). Cependant, le contenu des réseaux sociaux scientifiques est bien indexé par googl, et il est alors logique de parcourir régulièrement le fil de mise à jour à la recherche de quelque chose de complètement nouveau.



4) dans une catégorie distincte de BTS, on peut distinguer les sites régionaux ou spécialisés, où il y a principalement des données sur les publications publiées dans n'importe quel pays ou plusieurs pays (par exemple, la Bibliothèque électronique nationale elibrary.ru en Russie, l' Institut national d'informatique au Japon, la Bibliothèque nationale France ), ainsi que des sites spécialisés dédiés à certains domaines scientifiques spécifiques (par exemple, Biodiversity Heritage Library(BHL))



Une caractéristique de ces portails est qu'ils sont extrêmement réticents à autoriser les moteurs de recherche tiers à indexer leur contenu, donc si vous avez besoin de trouver quelque chose de français ou de japonais, il est plus fiable de regarder les sites pertinents et d'y rechercher.







Jusqu'à récemment, sur le site de la Bibliothèque nationale de France, toute l'interface était en français, jusqu'à ce qu'ils y attachent finalement une version anglaise du site, puis une traduction automatique sur IP



Séparément, il faut dire à propos de BHL. C'est un projet extrêmement utile pour tous les chercheurs impliqués d'une manière ou d'une autre dans l'étude des organismes modernes ou fossiles. Cette bibliothèque se distingue par un large éventail de sources (y compris diverses raretés) et la présence d'outils de recherche spéciaux (comme une recherche de taxons dans l'onglet Recherche avancée - si quelqu'un recueille des documents sur un groupe particulier d'animaux et de plantes, c'est un très bon moyen de trouver rapidement des publications sur sujet). Parmi les défauts de BHL, on peut noter que le calque de texte peut souvent être mal reconnu (avec la mauvaise langue), ainsi que la qualité monstrueuse des illustrations par défaut (la qualité d'un mauvais .djvu flou).



Étant donné que la qualité de l'image est généralement d'une grande importance pour les études taxonomiques, l'approche la plus correcte consiste à télécharger la publication requise au format jp2, puis à traiter les fichiers (d'abord reformatage en jpg / tiff normal, puis traitement de ScanTailor et OCR). À propos, toutes les publications de BHL sont publiées sur archive.org, et parfois il est plus pratique d'effectuer une recherche en texte intégral exactement sur archive.org (cela peut être pertinent en cas de recherche de raretés - quelque chose d'intéressant peut apparaître ici, y compris ceux téléchargés par les utilisateurs.







Un exemple de sortie lors d'une recherche par taxon sur BHL







Si vous avez besoin d'un PDF de haute qualité, il est préférable d'enregistrer le fichier en utilisant la méthode "Télécharger le contenu - Télécharger le livre - Télécharger JPEG 2000", puis traiter



Et, bien sûr, si vous avez besoin de trouver des publications en russe, vous ne pouvez pas vous passer d'une recherche dans la bibliothèque en combinaison avec cyberleninka . Bien que la couverture des sources dans la bibliothèque électronique soit beaucoup plus grande, nous rencontrons régulièrement une situation où la bibliothèque électronique propose de payer pour un article - et sur le site Web de Cyberleninki, le même article est dans le domaine public.



Malgré un certain nombre de lacunes inhérentes à la bibliothèque électronique, il semble dès la naissance (l'impossibilité de télécharger même le travail en libre accès sans entrer un nom d'utilisateur / mot de passe; l'absence de version anglaise et la possibilité de s'abonner à certaines mises à jour), la recherche y est assez décente. Mais s'il est nécessaire de suivre régulièrement les informations sur les magazines de langue russe, il convient également de créer un répertoire séparé de liens vers les sites des publications nécessaires - dans la bibliothèque, vous ne pouvez pas deviner quand et pourquoi ils peuvent soudainement fermer l'accès à certaines publications. Et encore une chose - dans le cas où le magazine n'est pas dans le domaine public et n'est distribué que pour de l'argent à la fois via la bibliothèque électronique et via le site Web de la maison d'édition, puis sur le site Web de la maison d'édition, les articles peuvent être moins chers (c'est le cas, par exemple, avec la revue "Oil Industry" ).







Paramètres de recherche avancés sur elibrary (sur la page d'accueil du site - en haut à gauche du lien "recherche avancée"). L'historique des requêtes de recherche précédentes est également conservé ici



5) Les plus grands projets «pirates» qui offrent un accès gratuit aux publications scientifiques - SciHub et LibGen - peuvent être considérés comme des BTS , car ils ont la possibilité de rechercher par titre de publication ou par mots-clés sous une forme ou une autre.

Et si sci-hub peut plutôt être utilisé comme un complément pratique à la recherche sur Dimensions, alors de rares monographies apparaissent régulièrement sur LibGen, qui ne se trouvent pas ailleurs - elles sont scannées par des passionnés et publiées sur LibGen en privé.



Et enfin, il convient de mentionner séparément la recherche de mémoires. Bien que de nombreuses dissertations (à la fois russes modernes et parfois étrangères assez anciennes) soient publiées sur Internet dans le domaine public et indexées par les moteurs de recherche, il est logique de consulter le site Web de VAK pour obtenir des informations sur les dernières mémoires dont la défense est uniquement prévue . Là, les thèses peuvent désormais être recherchées par spécialité, mots-clés, date de soutenance et autres paramètres (dans ce cas, la recherche est effectuée séparément pour les thèses VAK, et séparément pour celles qui sont défendues dans les conseils des organisations qui ont le droit de décerner des diplômes de manière indépendante). Mais il y a une nuance - si vous avez installé uBlock Origin, cela bloque la recherche sur ce site.







Un exemple de recherche sur le site web de VAK



A suivre.



All Articles