Ecosyst Bioc Chaîne trophique; Phytoplancton; Producteurs primaires; Zooplancton; consommateurs; modèle « top-down », « bottom-up », « wasp-waist  Migration verticale; Distribution en patch; Upwelling et zones frontales; Zone intertidate; Zonation; Macrophytes; Caulerpa; Herbiers à phan Mangrove; Pal Zones sableuses; R Coraux hermatypiques; Holobionte; Poissons p Poissons r Modèle dit de loterie; Faune des grands fonds; Fumeurs; Extrêmophiles.

Maitriser les outils informatiques et statistiques nécessaires aux science des données, en particuliers, l'importation, remaniement et transformation des données, la visualisation sous forme de graphiques, et l'inférence. Pouvoir présenter clairement et rigoureusement les résultats de ces analyses dans un rapport scientifique de manière reproductible. Etre capable d'analyser des données biologiques usuelles en pratique.

Contenu

Logiciels R, RStudio, git & Markdown. Importation et tranformation de tableaux de données. Visualisation de données uni-, bi- et multivariées à l'aide de graphiques. Statistiques descriptives; Moyenne; Médiane; Ecart type; Variance; Graphique quantile-quantile; Boite de dispersion; Histogramme; Population statistique; Echantillonnage; Inférence; Probabilité; Distribution de probabilité; Théorème central limite; Intervalle de confiance; Test d’hypothèse; Tests paramétriques et non paramétrique; Distribution binomiale, de Poisson, Chi-2, Normale, de Student et F; test de Student; ANOVA 1 et 2 facteurs; Test de Wilkoxon-Mann-Withney; Test de Kruskal-Wallis; Corrélation; Pearson; Spearman.

Compétences préalables

Notions de base d'utilisation d'un ordinateur. Notions de base en mathématique: artithmétique, y compris logarithme et exponentielle, systèmes de coordonnées cartésiennes et géométrie élémentaire dans le plan et dans un espace à 3 dimensions.

Etre capable d’analyser correctement des données biologiques multivariées en pratique. En particuliers, les méthodes d’ordination (ACP et AFC) et de classifications (amenant à la réalisation d’un dendrogramme) doivent être parfaitement maîtrisées à la fin du cours. Les étudiants apprennent à résoudre des cas concrets en posant correctement les questions d’un point de vue statistique. La modélisation des données sera également abordée via les modèles linéaires simples, polynomiaux et multiples. Ensuite, ils apprennent à décrire correctement les données, et à tester les conditions d’application des techniques envisagées. Ils apprennent également à tirer des conclusions appropriées par rapport à l’analyse effectuée, et à les formuler de manière rigoureuse. Nous insistons également sur la présentation des résultats (rédaction de rapports) et sur l’utilisation de logiciels professionnels dans le domaine de la science des données : R, RStudio, R Markdown, git.

Contenu

Statistiques multivariées: ACP; AFC; classification hiérarchisée; régression simple, polynomiale et multiple.

Compétences préalables

Bases en science des données, en particulier, la gestion de projets d'analyse des données, l'importation et le remaniement des données, la visualisation à l'aide de graphiques et la rédaction de rapports reproductibles. Statistiques uni- et bivariées de base, y compris ANOVA, variance, covariance et correlation.

Etre capable d’analyser correctement des données biologiques ayant une dépendance temporelle, d’ajuster un modèle non linéaire (courbe de cinétique, de croissance, dose-réponse, etc.) et de retrouver l’information pertinente dans un gros jeu de données à l’aide de techniques de foullle de données et de classification supervisée. Etre capable de présenter ses résultats de manière reproductible (rédaction de rapports) et utiliser des logiciels professionnels dans le domaine de la science des données : R, RStudio, R Markdown, git.

Contenu

Séries spatio-temporelles; Classification supervisées; Random Forest; Analyse discriminante linéaire; Régression non linéaire; Modèles de croissance; Courbe dose-réponse; Von Bertalanffy; Richards; Weibull; Gompertz; logiciels R, RStudio y compris R Markdown et Notebook, git.

Compétences préalables

Bases en science des données, en particulier, la gestion de projets d'analyse des données, l'importation et le remaniement des données, la visualisation à l'aide de graphiques et la rédaction de rapports reproductibles. Statistiques uni- et bivariées de base, y compris ANOVA, variance, covariance et correlation.

Bonnes pratiques de design expérimental, d'organisation des données et des analyses afin de permettre leur partage en équipe (collaboration) ou de manière plus large (Open Science). Techniques statistiques propres au sujet traité. Maitrise des logiciels dédiés (autour de R).

Gestion des données; bases de données; requêtes SQL; langage S (logiciel R) avec RStudio; calcul en virgule flottante; génération de nombre pseudo-aléatoires; analyse reproductible; tests unités; format des données; optimisation du temps de calcul; optimisation de l'utilisation de la mémoire vive; algorithmes vectorisés, ...

Anglais; Communication scientifique; Poster; Présentation orale; Colloque.