Rencontre avec Maxime Kubryk, Senior Data Scientist chez Adot .

Découvrez chaque mois une personnalité d’Adot. Ce mois-ci, c’est Maxime Kubryk, Senior Data Scientist chez Adot qui fait le point sur son parcours professionnel, ses rôles et missions, ainsi que son expérience au sein de l’entreprise.

Ce qui a été le plus motivant est sûrement l’intérêt et la difficulté des projets que j’ai eu à réaliser, parce que c’est très formateur. Il y a aussi le fait que les projets data chez Adot ont un impact sur le business et ne restent pas juste à l’état d’expérimentations.

 
 

Maxime Kubryk
Senior Data Scientist

MaxKubrick

Peux-tu te présenter et nous expliquer ton parcours professionnel en quelques mots ?

Je suis Data Scientist Senior chez Adot, je suis arrivé dans l’entreprise en 2016 au tout début de l’équipe Data. 

Concernant mon parcours professionnel, j’ai d’abord fait de la recherche en astrophysique pendant trois ans pour obtenir mon doctorat. Pendant cette période, j’ai travaillé sur la formation et l’évolution des galaxies : j’analysais notamment les résultats de très grosses simulations (quelques centaines de Go de résultats) qui me servaient à tester la théorie en comparant des galaxies simulées avec les observations. C’est donc pendant ma thèse que j’ai commencé à explorer le sujet du traitement des données, du Big Data, et je suis rapidement tombé sur le sujet de l’intelligence artificielle qui est directement lié. J’ai tout de suite été fasciné par ce domaine qui est un vrai sujet de recherche très actif dans lequel il y a régulièrement de grandes avancées. Une fois ma thèse terminée, j’ai donc suivi une formation d’un an sur le Big Data et machine learning à Telecom Paris pour devenir Data Scientist. À la fin de cette formation, j’ai fait mon stage chez Adot et j’y ai été embauché ensuite.

Quel est ton rôle au sein du département “ Data ” de Adot ? Peux-tu nous raconter ta journée type par exemple ?

Un des intérêts de l’intelligence artificielle (et en particulier du machine learning) est que ça permet de construire des outils capables de mettre un peu d’intelligence là où des êtres humains n’en ont pas la capacité physique. Par exemple, un humain pourrait catégoriser des pages web sans problème mais cela prendrait beaucoup de temps, et il faudrait des milliers d’employés pour catégoriser toutes les pages que nous recevons. Donc en pratique cette tâche n’est pas humainement faisable à cause du volume de données à traiter. En revanche, un programme peut être très rapide pour lire du texte, faire des calculs et classifier le contenu etc. On peut donc en faire de très bons outils pour catégoriser tout notre trafic. Mais il faut donner au programme un peu d’intelligence pour qu’il choisisse les bonnes catégories, et c’est à ça que sert le machine learning : à rendre un programme suffisamment intelligent pour résoudre une tâche donnée. 

Dans ce contexte, mon rôle est essentiellement d’essayer de rendre des programmes suffisamment intelligents pour être utiles d’un point de vue business.

Ce qui implique généralement d’abord une phase de R&D où je cherche la bonne méthode pour résoudre le problème puis une phase de mise en production du produit final. Je dois aussi interagir avec les autres équipes pour comprendre les problèmes à résoudre, discuter de ce qui est faisable, et finalement expliquer la solution trouvée. 

Peux-tu nous en dire plus sur le pôle Data chez Adot et les objectifs auxquels il répond ?

Le pôle data chez Adot a plusieurs objectifs. 

D’abord, nous avons une équipe de Data Engineers qui fait en sorte que toute la donnée que nous recevons (et nous en recevons beaucoup, et de sources assez variées !) soit utilisable de la manière la plus simple possible. Il y a aussi des données cruciales pour le business de la boîte qu’on ne veut surtout pas perdre et les Data Engineers d’Adot sont responsables de la création et maintenance d’outils qui doivent être les plus résilients possible en cas de problème. Ce sont des projets qui nécessitent de solides compétences avec les outils de Big Data. Cette partie de l’équipe est donc primordiale parce que sans elle, on ne pourrait rien faire de nos données.

Ensuite, l’équipe de Data Scientists s’occupe de construire de nouveaux outils utiles pour Adot en utilisant les données préalablement travaillées par l’équipe Data Engineers. 

Enfin, nous avons également une équipe Data Ops, qui a des missions multiples dont la principale est de faire l’interface avec les équipes plus opérationnelles sur les campagnes et de répondre à leurs besoins/questions concernant les données disponibles.

Quels ont été les projets les plus marquants sur lesquels tu as pu travailler chez Adot et pourquoi ?

Le projet qui m’a le plus marqué est celui visant à extraire les thèmes principaux de pages web parce que c’est le projet le plus difficile et le plus long que j’ai eu à mener. D’ailleurs la première version de ce projet est en phase de test, on s’approche donc du but ! Toutefois il faudra continuer à travailler dessus et améliorer de façon continue les résultats. Un autre aspect marquant de ce projet, c’est que les compétences acquises sur les modèles capables de “comprendre” le langage pourront être utilisées sur des projets connexes comme la brand safety ou l’extraction de thèmes pour d’autres langues que le français.

Quelles sont, selon toi, les compétences indispensables pour travailler dans la Data ?

Techniquement, il faut des compétences en maths appliquées et en développement. Il faut aussi des compétences liées à la R&D comme savoir se débrouiller avec des problèmes mal posés au départ et pour lesquels on n’a pas de solution toute faite, ou encore s’adapter aux contraintes rencontrées en chemin et des fois avoir un peu d’imagination. Il faut aussi une certaine tolérance à l’échec parce qu’on doit souvent tester plusieurs approches qui ne marchent pas vraiment avant d’en trouver une qui marche suffisamment bien. Ça veut dire, par exemple, accepter de devoir jeter un travail sur lequel on a passé du temps mais qui ne marche pas aussi bien qu’une autre solution. Par ailleurs, c’est un domaine qui évolue très rapidement. Il faut donc avoir le goût d’apprendre de nouveaux concepts et de nouveaux outils, de la curiosité, de l’adaptabilité.

Cela fait maintenant plusieurs années que tu as rejoint Adot, peux-tu nous dire ce qui a été le plus motivant durant ton parcours au sein de la société et au sein de l’équipe Data ?

Ce qui a été le plus motivant est sûrement l’intérêt et la difficulté des projets que j’ai eu à réaliser, parce que c’est très formateur. Il y a aussi le fait que les projets data chez Adot ont un impact sur le business et ne restent pas juste à l’état d’expérimentations. Et enfin, l’autonomie laissée par notre manager sur les aspects techniques et la gestion de projet est très appréciable : on nous fait confiance.

As-tu un message à faire passer à nos collaborateurs ou nos futurs collaborateurs qui voudraient notamment rejoindre l’équipe Data ?

L’équipe est sympa et nous avons plein de projets très intéressants et qui auront un impact sur le business de la boîte ! Le message que j’aurais à faire passer à un nouveau membre de la Data (ou d’une autre équipe) serait donc d’oser proposer des idées et d’oser challenger les idées déjà proposées. C’est essentiel pour qu’Adot reste une des meilleures boîtes de son domaine.

Vous voulez en savoir plus ? 

Nos dernières actualités .