Changer la capture des données : le lien critique pour Airbnb, Netflix et Uber
Vous n’avez pas pu assister à Transform 2022 ? Découvrez dès maintenant toutes les sessions du sommet dans notre bibliothèque à la demande ! Regardez ici.
La pile de données moderne (MDS) est fondamentale pour les perturbateurs numériques. Pensez à Netflix. La société a lancé un nouveau modèle commercial autour de la vidéo en tant que service, mais une grande partie de son succès repose sur des données de diffusion en temps réel.
Ils utilisent des analyses pour proposer des recommandations très pertinentes aux téléspectateurs. Ils surveillent les données en temps réel pour maintenir une visibilité constante sur les performances du réseau. Ils synchronisent leur base de données de films et d’émissions avec Elasticsearch pour permettre aux utilisateurs de trouver rapidement et facilement ce qu’ils recherchent.
Cela doit être en temps réel et être précis à 100 %. Extraire, transformer, charger (ETL) à l’ancienne est tout simplement trop lent. Pour répondre à ce besoin, Netflix a créé un outil de capture de données modifiées (CDC) appelé DBLog qui capture les modifications dans MySQL, PostgreSQL et d’autres sources de données, puis diffuse ces modifications vers les magasins de données cibles à des fins de recherche et d’analyse.
Netflix nécessite une haute disponibilité et une synchronisation en temps réel. Ils devaient également minimiser l’impact sur les bases de données opérationnelles. Le CDC supprime les journaux de la base de données, répliquant les modifications apportées aux bases de données cibles dans l’ordre dans lequel elles se produisent, de sorte qu’il capture les modifications au fur et à mesure qu’elles se produisent, sans verrouiller les enregistrements ni enliser la base de données source.
événements
MetaBeat 2022
MetaBeat réunira des leaders d’opinion pour donner des conseils sur la façon dont la technologie métaverse transformera la façon dont toutes les industries communiquent et font des affaires le 4 octobre à San Francisco, en Californie.
Inscrivez-vous ici
Les données sont au cœur de ce que fait Netflix, mais ils ne sont pas les seuls à cet égard. Des entreprises comme Uber, Amazon, Airbnb et Meta prospèrent parce qu’elles savent vraiment comment tirer parti des données. La gestion et l’analyse des données sont des piliers stratégiques pour ces organisations, et la technologie CDC joue un rôle central dans leur capacité à mener à bien leurs missions principales.
La même chose peut être dite de presque toutes les entreprises opérant au sommet de leur art dans l’environnement commercial d’aujourd’hui. Si vous souhaitez que votre entreprise fonctionne comme un acteur de premier plan, vous devez moderniser et maîtriser vos données. Vos concurrents le font certainement déjà.
L’intégration en moins d’une seconde est la nouvelle norme chez Airbnb et Uber
Dans le monde d’aujourd’hui, une expérience client solide nécessite des flux de données en temps réel. Airbnb a reconnu la valeur de la technologie CDC dans la création d’un excellent CX pour ses clients et ses hôtes. Eux aussi ont construit leur propre plate-forme CDC, qu’ils appellent SpinalTap. La tarification dynamique d’Airbnb, la disponibilité des annonces et le statut des réservations exigent une précision et une cohérence sans faille sur tous les systèmes. Lorsqu’un client Airbnb réserve une visite, il s’attend à ce que les flux de travail soient très rapides et précis à 100 %.
Pour Uber, l’immédiateté est sans doute encore plus importante. Qu’un client attende d’être conduit à l’aéroport ou commande une livraison de nourriture, le timing est essentiel. Tout comme Netflix et Airbnb, ils ont développé leur propre plate-forme CDC pour synchroniser les données sur plusieurs magasins de données en temps réel. Encore une fois, un ensemble commun d’exigences a émergé. Uber avait besoin que sa solution soit extrêmement rapide et tolérante aux pannes, sans aucune perte de données. Ils avaient également besoin d’une solution qui ne réduirait pas les performances de leurs bases de données source.
Changer la capture de données pour le reste d’entre nous
Une fois de plus, CDC fait l’affaire. Auparavant, l’ETL en mode batch du jour au lendemain aurait pu être suffisant pour fournir une mise à jour quotidienne de la direction ou des rapports opérationnels. Aujourd’hui, le temps réel est de plus en plus la norme. Si l’information est le pouvoir, alors l’accès immédiat à l’information est le turbo.
C’est pourquoi le CDC devient rapidement une exigence fondamentale pour la pile de données moderne. C’est bien beau, cependant, que de grandes entreprises comme Netflix, Airbnb et Uber aient les ressources nécessaires pour créer des plateformes CDC personnalisées – mais qu’en est-il des autres ?
Les solutions CDC prêtes à l’emploi comblent cette lacune en fournissant les mêmes pipelines de streaming à faible latence et de haute qualité sans qu’il soit nécessaire de créer à partir de zéro.
Malheureusement, ils ne sont pas tous créés égaux. La plupart des entreprises exploitent un ensemble de systèmes qui gèrent la planification des ressources d’entreprise (ERP), la gestion de la relation client (CRM) ou des fonctions opérationnelles spécialisées telles que les achats ou les RH. Ceux-ci s’exécutent sur différentes plates-formes de bases de données, avec des modèles de données incongrus. Si une entreprise exploite des systèmes mainframe, elle est probablement confrontée à des structures de données obscures qui ne s’intègrent pas facilement aux données relationnelles modernes.
Cela rend l’intégration hétérogène particulièrement importante. Cela nécessite une connexion à plusieurs sources et cibles de données, y compris des bases de données transactionnelles telles que SAP, Oracle, IBM Db2 et Salesforce. Cela signifie fournir des données de streaming en temps réel à des plates-formes telles que Databricks, Kafka, Snowflake, Amazon DocumentDB et Azure Synapse Analytics.
Automatisation CDC en temps réel
Pour piloter l’intelligence artificielle (IA) et l’analytique avancée, les entreprises doivent transférer leurs données vers une plate-forme MDS commune. Cela signifie ingérer des informations provenant de diverses sources, les transformer pour les adapter à un modèle d’analyse unifié et les transmettre à une plate-forme de données moderne basée sur le cloud.
La technologie de capture de données modifiées sert de maillon essentiel dans la chaîne de valeur axée sur les données, d’abord en automatisant l’ingestion de données à partir de systèmes sources, puis en les transformant à la volée et en les livrant à une plate-forme de données cloud. L’automatisation CDC en temps réel garantit que les bonnes informations parviennent immédiatement au bon endroit.
Parce qu’ils se concentrent uniquement sur les données qui ont changé, les pipelines CDC en continu offrent d’énormes avantages d’efficacité par rapport aux opérations en mode batch du passé. Les meilleures solutions CDC peuvent fournir plus de 100 téraoctets de données de la source à la cible en moins de 30 minutes, sans aucune perte de données.
Le passage au cloud computing est bien souterrain. L’analyse cloud, en particulier, offre des avantages distincts aux entreprises qui comprennent vraiment le rôle transformationnel des données. Les entreprises leaders de tous les secteurs alignent leurs visions stratégiques autour de l’analyse de données. Ils numérisent leurs interactions avec les clients et utilisent des algorithmes pour étudier les données, extraire des informations et prendre des mesures. L’IA et l’apprentissage automatique ingèrent de grandes quantités d’informations, découvrent des corrélations et identifient des anomalies.
Que vous ouvriez la voie en matière de perturbation numérique ou que vous essayiez simplement de suivre le rythme, la technologie CDC jouera un rôle central pour faire de la pile de données moderne une réalité et ouvrir la porte à la transformation numérique.
Gary Hagmueller est PDG d’Arcion.
DataDecisionMakers
Bienvenue dans la communauté VentureBeat !
DataDecisionMakers est l’endroit où les experts, y compris les techniciens travaillant sur les données, peuvent partager des informations et des innovations liées aux données.
Si vous souhaitez en savoir plus sur les idées de pointe et les informations à jour, les meilleures pratiques et l’avenir des données et de la technologie des données, rejoignez-nous sur DataDecisionMakers.
Vous pourriez même envisager de rédiger votre propre article !
En savoir plus sur DataDecisionMakers