R sur le Serveur de Calcul Statistique

SMCS

Description

Voici, extrait du site "The R Project for Statistical Computing", la traduction d'une partie de "Introduction to R" qui y est donnée:

R est un langage et environnement pour calculs statistiques et graphiques. Il s'agit d'un projet GNU semblable au langage et environnement S. R peut être considéré comme une implémentation différente de S.

R procure une large gamme de techniques statistiques (modèles linéaires et non-linéaires, tests statistiques classiques, analyse de séries temporelles, classification,...) et graphiques. Le langage S est souvent choisi en recherche statistique méthodologique.

L'une des forces de R est la facilité de production de graphiques de bonne qualité destinés à la publication, incluant des symboles mathématiques et formules si nécessaire. Un grand soin a été consacré au choix des options par défaut des graphiques, mais l'utilisateur garde le contrôle complet du design de ses graphiques.
 

Versions disponibles

La version suivante de R est disponible sur le serveur d'applications statistiques de l'UCL :

  • R 4.0.0 sur smcs1 et smcs2
     

Packages

Les packages suivants sont installés par défaut à l'installation de R : base, datasets, grDevices, graphics, grid, methods, splines, stats, stats4, tcltk, tools et utils. Les packages dit recommended ont également été installés.

Si vous souhaitez l'installation d'autres packages sur le serveur de l'UCL, vous pouvez en faire la demande à serveurs-smcs@uclouvain.be pour que tous les utilisateurs puissent avoir accès à ce package, sinon vous pouvez l'installer vous-même dans votre home.

Utilisation sur le serveur

On distingue deux modes d'utilisation de R (votre VPN doit être activé si vous n'êtes pas dans le réseau UCLouvain) :

  • le plus simple: au travers de votre navigateur internet ;
  • en batch après connexion par ssh.

À travers un navigateur internet

RStudio server est installé sur les serveurs, ce qui permet d'utiliser l'interface de RStudio à travers un des navigateurs internet suivants: Chrome, Firefox ou Safari. Cela nécessite seulement l'installation d'un des navigateurs internet mentionnés et rien d'autre. Pour ouvrir une session R par ce biais, vous devez ouvrir votre navigateur et entrer l'adresse smcs1.cism.ucl.ac.be/rstudio/auth-sign-in ou smcs2.cism.ucl.ac.be/rstudio/auth-sign-in. La fenêtre suivante apparait:

Connexion

Vous devez alors entrer l'identifiant et le mot de passe au serveur. Si tout s'est bien passé, vous arriverez sur la fenêtre ci-dessous:

Ouverture

Pour les personnes connaissant RStudio, c'est exactement la même fenêtre que la version Desktop au bouton upload près (entouré sur l'image ci-dessus). Ce bouton vous permet de facilement transférer des fichiers, comme des données ou du code, sur le serveur. Une fois cela fait, vous pouvez exécuter votre programme, quitter votre session et revenir plus tard voir les résultats. 

Il est déjà arrivé lors de nos tests que RStudio Server s'arrête de fonctionner. Si votre programme n'est pas terminé, il continue de tourner mais vous ne pouvez plus y accéder via RStudio. Il vous sera toujours accessible en batch et à nouveau via RStudio une fois RStudio Server redémarré (il faut en faire la demande à serveurs-smcs@uclouvain.be). Pour plus de sécurité, il est recommandé de sauvegarder les résultats et les graphiques au fur et à mesure de votre programme. 

En batch

Il faut se connecter au serveur en ssh et uniquement ssh (voir la page https://uclouvain.be/chercher/smcs/faq-des-serveurs-de-calcul-statistique.html#putty pour plus de détails). Le transfert des fichiers peut se faire par sftp ou par scp avec par exemple FileZilla ou WinSCP.

Dans un premier temps, vous devez exécuter les commandes suivantes : module load releases/2020a et module load R/4.0.0-foss-2020a avant de pouvoir utiliser R. Ensuite, quand le code et les données sont présents dans votre home, vous pouvez exécuter R en batch en entrant R CMD BATCH code.R sortie.out & dans le terminal. Ceci vous permet de lancer le programme contenu dans code.R et de sauvegarder les résultats textuels dans le fichier sortie.out mais également de garder la main pour exécuter d'autres commandes. Attention, vous devez sauvegarder vos graphiques dans le programme code.R sans quoi vous ne pourrez pas les voir. 

Comme votre code tourne en background, vous pouvez à l'aide de la commande top vérifier s'il tourne encore.

En cas de questions

Pour demander l’installation de packages supplémentaires ou en cas de problèmes lors de l'utilisation de R sur le serveur, vous pouvez contacter serveurs-smcs@uclouvain.be