Elles sont partout, en grandes quantités et pourtant on ne les voit pas … Ce sont les datas ! Mais à quoi correspond t-elles réellement ?  

La data c’est quoi ?

La data c'est quoi ?

L’évolution des technologies a considérablement changé notre façon de partager et d’émettre des informations. C’est pourquoi les chercheurs ont dû trouver une façon d’analyser ces nouvelles données. On appelle data une donnée générée par une action que tu réalises sur internet.

Que signifie « big data »?

Big datas signifie « grosses données » en anglais. Ce terme désigne un regroupement de techniques permettant de traiter des volumes importants de données structurées ou non structurées. 

Chaque jour, tu produis des données quand tu fais une recherche sur Google, que tu envoies un message sur Facebook, que tu regardes une série sur Netflix et même quand tu envoies un GIF de chat par email à ton collègue de bureau.

Toutes ces données, à la fois différentes et nombreuses sont ainsi traitées par le big data afin de les transformées en informations utiles.

Pour faire court, le big data se résume en 3 parties : 

  • Le Volume : les entreprises comme les particuliers produisent chaque jour une quantité astronomique de données. 
  • La Vitesse : Avec l’essor des nouvelles technologies, des objets connectés et des réseaux sociaux, les datas sont de plus en plus faciles et rapides à partager. 
  • La Variété : Ces « méga données » se présentent sous toutes les formes : du texte, des likes, des audios, des clics, des recherches, des mails, des photos, des géolocalisation … 

Aujourd’hui une personne génère en 1 minute 100 Mo de données ce qui représente environ 25 musiques par personne et par minute (une musique environ 3 et 5 Mo).

Pourquoi et comment on utilise la data aujourd’hui ?

Comment utilise t-on le data

Les données sont une vraie mine d’or pour les entreprises. Elles leur permettent d’analyser le comportement ainsi que les envies des consommateurs en fonction des recherches qu’ils effectuent. Ces datas sont ensuite analysées pour détecter les tendances, élaborer des stratégies, et concevoir un produit.

Cela nous permet à nous, consommateurs, de profiter d’expériences de plus en plus personnalisées comme une playlist créée en fonction de nos goûts sur Spotify, une recommandation de films sur Netflix ou la suggestion d’une chambre d’hôtel lors de l’achat d’un billet d’avion. 

Chiffres 2020 liés aux datas

D’après une étude réalisée par Enedis en collaboration avec L’OBS les datas en 2020 c’est : 

  •  203 milliards de dollars
    C’est le poids que représenteraient les Big Datas sur le marché mondial en 2020.
  •  1,7 Mo
    Soit la quantité de données produite par personne et par seconde en 2020.
  •  200 milliards
    C’est le nombre d’appareils connectés dans le monde en 2020.
  • 14%
    C’est le pourcentage d’émissions de C02 que pourrait produire le stockage de données d’ici 2040, soit autant que les État-Unis en 2020.

Où sont stockées ces données ?

Data Center

C’est là qu’interviennent les centres de données AKA les datas center. Ces infrastructures composées d’ordinateurs de routeurs, de sous-systèmes de stockage et toutes autres sortes de câbles et d’équipements informatiques, permettent aux entreprises de collecter, traiter et stocker les données. En plus clair, c’est grâce à ces centres de données que tu peux écouter ta playlist préférée sur Spotify ou regarder des films sur Netflix.
Mais tout cela n’est pas sans conséquence sur notre environnement…

Le Big Data et l’environnement

Même si elle n’est pas (ou peu) visible, la pollution émise par les datas est pourtant réelle. 

Quel impact sur notre environnement ?

Bien que la phase de production d’un smartphone soit la plus polluante, son utilisation reste elle aussi un facteur d’émissions de CO2. 

Aujourd’hui tout est réalisable à partir de nos téléphones : régler la luminosité d’une pièce, visionner un film, jouer en ligne, faire des appels vidéos … Et tout cela consomme. En effet, le simple fait d’effectuer une recherche sur Google produit 7g gramme de CO². On considère même que si Internet était un pays, il serait le 3e plus gros consommateur d’électricité derrière les États-Unis et la Chine.
Près de 34 millions d’emails sont envoyés chaque heure soit l’équivalent de 14 tonnes de pétrole. Mais ce n’est pas tout, les datas center ont eux aussi une (grosse) part de responsabilité.

Afin d’en assurer le bon fonctionnement, le data center doit également comprendre un système de distribution d’énergie, un commutateur électrique, des réserves d’énergie, des générateurs (dédiés au backup), un système de ventilation et de refroidissement, une puissante connexion internet …
Cependant, tous ces équipements consomment beaucoup d’énergies entraînant des répercussions sur notre environnement. 

Le volume mondial de données actuel est de près de 59 milliards de téraoctets, mais ce chiffre n’est pas près de s’arrêter là, il pourrait être multiplié par 3,7 entre 2020 et 2025, 3,5 tous les cinq ans jusqu’en 2035.

Comment les datas center militent en faveur de l’environnement

Malgré les conséquences désastreuses que peuvent provoquer les big datas et les datas center, des solutions ont été pensées par certaines entreprises afin de lisser leurs impacts sur l’environnement

En effet, depuis quelques années des Datas Center Green voient le jour avec comme objectifs des centres de données moins gourmands en énergies et plus responsables. 

Un refroidissement naturel

Rien que leur refroidissement représente près de 40% de l’énergie qu’ils consomment. Le but est donc de réduire cette consommation en les délocalisant des pays froids afin que le refroidissement se fasse naturellement. C’est le choix qu’a fait Facebook en 2014 en installant l’un de ses datas center à Luleå en Suède.

L’air naturellement frais de cette petite ville de Laponie permet au réseau social de réaliser de belles économies mais surtout de limiter son impact énergétique.

Recycler la chaleur qu’ils produisent

Comment les datas center militent en faveur de l'environnement

Une autre option possible est la valorisation de la chaleur qu’ils génèrent. Des datas center ont été installés dans les sous-sols de la piscine de la Butte-aux-Cailles. Le but ? Utiliser la chaleur produite par les serveurs afin de maintenir l’eau de la piscine à 27°C. Et le constat est sans appel, ce système a permis d’économiser l’équivalent de 45 tonnes de CO2 par an.