La science des données en tant que discipline – et les compétences spécifiques en apprentissage automatique, en analyse et en algorithmes de formation – sont très demandées.

C’est un domaine qui a explosé en popularité au cours de la dernière décennie et qui devrait créer 11,5 millions de nouveaux emplois aux États-Unis seulement d’ici 2026.

Alors, qu’est-ce que ça fait de travailler en tant que data scientist, et que devez-vous savoir si vous envisagez de commencer votre carrière là-bas (ou d’y faire la transition plus tard dans la vie) ?

J’ai demandé à Naveed Ahmed Janvekar, un scientifique principal des données de Seattle qui travaille dans l’équipe de prévention des fraudes et des abus d’Amazon, de partager son parcours professionnel.

Découvrez son histoire et les conseils qu’il a pour ceux qui souhaitent poursuivre une carrière en science des données.

Une étincelle : Utiliser l’apprentissage automatique pour résoudre des problèmes du monde réel

Qu’est-ce qui vous a amené à une carrière en science des données ?

Naveed Janvekar : Mon intérêt pour l’apprentissage automatique s’est accru lorsque je travaillais pour Fidelity Investments en tant que développeur de logiciels.

J’avais des collègues qui travaillaient comme analystes avec des données pour identifier les tendances, ce qui m’a rendu curieux d’explorer ce domaine. J’ai donc commencé à analyser mes transactions financières personnelles pour générer des tendances et des idées.

Cela a conduit à passer plus de temps à rechercher l’apprentissage automatique et à savoir comment l’exploiter pour modéliser des modèles répétitifs afin de prédire les résultats futurs et de l’utiliser à notre avantage pour résoudre des problèmes critiques à grande échelle.

Afin d’acquérir une meilleure expertise dans ce domaine, j’ai décidé de poursuivre mon Master en sciences de l’information avec une spécialisation en Machine Learning et Analytics.

Après l’obtention de mon diplôme, j’ai travaillé dans diverses entreprises basées aux États-Unis dans différents rôles analytiques tels que Analyst chez Nanigans (une startup AdTech basée à Boston), Business Intelligence Developer chez KPMG et Senior Data Scientist chez Amazon.

Le rôle de l’IA dans la sécurité des données

Quel rôle joue le machine learning dans votre travail en tant que Sr. Data Scientist chez Amazon ?

Naveed Janvekar : L’apprentissage automatique et la science des données jouent un rôle essentiel dans mon travail chez Amazon.

Dans l’équipe de prévention des abus, nous utilisons divers algorithmes de classification et algorithmes d’apprentissage en profondeur pour détecter les fraudes et les abus sur la plateforme.

L’apprentissage automatique aide à atteindre l’évolutivité et la détection de haute précision par rapport à la détection d’abus traditionnelle basée sur des règles et/ou sur des heuristiques.

Alors que les comportements d’abus deviennent complexes au fil du temps, l’apprentissage automatique nous aide à relever ce défi puisque nous réentraînons constamment les modèles avec les derniers comportements/modèles d’abus.

J’ai déposé des brevets pour des inventions liées à la détection d’abus émergents sur la plateforme en utilisant le machine learning.

Communiquer des informations basées sur les données

Selon vous, quelle compétence ou expérience inattendue vous a aidé en tant que professionnel de la science des données ?

Naveed Janvekar : La capacité d’acquérir une expertise dans le domaine et d’être capable de communiquer de manière efficace et simpliste des informations aux parties prenantes de l’entreprise m’a le plus aidé en tant que professionnel de la science des données.

Lorsque j’ai commencé mon parcours en science des données, j’ai mis beaucoup plus l’accent sur les détails techniques que sur le fait d’être un conteur efficace.

Mais au cours des dernières années, j’ai réalisé qu’être capable de communiquer des récits et des idées issus de la science des données ou de l’apprentissage automatique est aussi important que la mise en œuvre de stratégies d’apprentissage automatique.

Travailler avec des algorithmes pour créer le changement

Comment les entreprises devraient-elles adapter leur approche dans cet espace à l’avenir ?

Naveed Janvekar : Dans le passé, la prévention de la fraude se faisait traditionnellement à l’aide de règles heuristiques métier.

Si vous avez observé qu’un certain modèle apparaît fréquemment au fil du temps, vous pouvez définir une règle métier pour signaler le même modèle à l’avenir.

Cependant, il s’agit d’une solution à court terme. Il ne suit pas l’évolution des schémas de fraude.

C’est là que l’apprentissage automatique et l’IA entrent en jeu et ont changé le paysage.

Désormais, les modèles sont formés à l’aide de données historiques sur plusieurs comportements de fraude, ce qui rend ces modèles robustes et aide les algorithmes à apprendre des comportements complexes, ce qui est beaucoup plus difficile à faire pour les humains.

Les entreprises ont commencé à utiliser l’apprentissage automatique dans la détection des fraudes. Ils doivent désormais se concentrer sur des aspects tels que le réentraînement automatisé des modèles pour capturer les derniers comportements en matière de fraude et rendre les modèles très précis.

Cela permet d’automatiser les actions à la suite de la sortie du modèle, plutôt que d’avoir des auditeurs humains nécessaires pour évaluer les entités suspectes qui sont signalées après coup.

Travailler avec des données et des algorithmes peut être difficile

Mais qu’est-ce qui le rend excitant et amusant?

Naveed Janvekar : J’ai apprécié l’ingénierie des fonctionnalités à partir des données, ce qui fait ressortir mon côté créatif.

Sur la base de l’expertise du domaine, les scientifiques des données peuvent exploiter les données de différentes manières pour répondre aux questions des parties prenantes de l’entreprise, effectuer une analyse exploratoire des données, trouver des corrélations entre les variables et mener une ingénierie des fonctionnalités pour de meilleures performances du modèle.

En ce qui concerne les algorithmes, j’ai toujours expérimenté la formation de différents types sur des ensembles de données de formation, la réalisation d’évaluations et une analyse approfondie des raisons pour lesquelles certains algorithmes fonctionnent mieux que d’autres.

Cela m’aide à mieux comprendre ces algorithmes et les situations où ils fonctionnent – ​​et où ils ne fonctionnent pas.

Tout cela rend le travail amusant et excitant pour moi.

Faire partie de la communauté des sciences des données

Quel conseil utile voudriez-vous partager avec les débutants en science des données qui s’intéressent à ses applications dans le marketing et le commerce et qui souhaitent peut-être se perfectionner dans ce domaine ?

Naveed Janvekar : Une suggestion utile serait de participer à la recherche et aux inventions dans le domaine de l’apprentissage automatique et de la science des données.

Faites partie de groupes de travail qui tentent de résoudre des problèmes dans votre domaine d’intérêt à l’aide de l’apprentissage automatique.

Contribuez à leurs recherches, obtenez les commentaires de vos pairs, publiez des articles et déposez des brevets.

Grâce à ces mécanismes, vous contribuez activement à la communauté scientifique, apprenez constamment de vos pairs et améliorez vos compétences.

C’est aussi une bonne idée d’avoir un mentor en science des données.

Suivre les tendances SEO

Comment un data scientist reste-t-il à jour et informé dans le domaine du SEO ?

Naveed Janvekar : Dans le domaine du référencement, l’apprentissage automatique aide à comprendre les requêtes, la recherche vocale et la personnalisation.

Les scientifiques des données peuvent explorer l’application de divers algorithmes de pointe pour les cas d’utilisation SEO afin de mesurer l’efficacité des nouveaux algorithmes.

Cela permettra aux scientifiques de données de se tenir au courant des dernières tendances du secteur, ainsi que de mettre à jour la pile d’apprentissage automatique dans les entreprises liées au référencement.

Il existe diverses revues et conférences, telles que la conférence internationale IEEE, sur l’apprentissage automatique et les applications pour vous aider à en savoir plus sur les dernières tendances en matière d’apprentissage automatique.

Ce n’est pas directement lié au référencement, mais vous aidera à comprendre les avancées technologiques qui perturberont votre espace ensuite.

Davantage de ressources:

  • Diriger le référencement grâce à la révolution de la science des données : questions et réponses du CTO
  • Recherche de vecteurs : optimiser l’esprit humain avec l’apprentissage automatique
  • Le PDG de Deepcrawl parle des opportunités de référencement, de la croissance et de la planification pour 2022

Image en vedette : Avec l’aimable autorisation de Naveed Janvekar

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici