L'Auto-Tune, inventé par un ingénieur du pétrole

Le son le plus clivant de la pop moderne est né de la recherche de pétrole. Avant que l'Auto-Tune ne recouvre un million de refrains de ce scintillement vitreux et robotique, les maths qui le font tourner s'occupaient de quelque chose de bien moins glamour : écouter les échos rebondir sur des couches de roche enfouies à un kilomètre sous terre, pour deviner où forer. L'homme qui l'a conçu, Harold « Andy » Hildebrand, ne cherchait pas à révolutionner la musique. Il cherchait du pétrole — et les outils qu'il a affûtés pour ça se sont révélés être exactement ce qu'il faut pour remettre une fausse note sur le bon ton.
L'ingénieur qui écoutait les roches
Hildebrand décroche un doctorat de génie électrique à l'université de l'Illinois en 1976 et file droit chez Exxon, où il passe une bonne partie de sa carrière dans l'interprétation de données sismiques. Le métier paraît abstrait, mais le principe est simple et même assez beau : on déclenche une explosion contrôlée en surface, on enregistre les ondes sonores tandis qu'elles ricochent sur les couches de roche souterraines, et à partir du timing et de la forme de ces échos, on reconstruit une image de la géologie cachée en dessous.
Le hic, c'est qu'un enregistrement sismique brut est un fouillis — échos superposés, bruit, distorsion. Pour en extraire un signal propre, les géophysiciens s'appuient sur une boîte à outils de traitement du signal : l'autocorrélation, qui mesure à quel point une onde ressemble à une copie d'elle-même décalée dans le temps, et le codage prédictif linéaire, une façon de modéliser un signal en prédisant chaque nouvel échantillon à partir des précédents. Rien d'ésotérique là-dedans. C'étaient les mathématiques du quotidien de la recherche pétrolière.

En 1982, Hildebrand cofonde Landmark Graphics, qui vend à l'industrie pétrolière des stations de travail 3D pour visualiser les données sismiques. C'est, à tout point de vue, un ingénieur prospère dans la tech d'exploration. Une anecdote qu'il aime raconter : à ses débuts chez Exxon, il démêle un problème de surveillance sismique défaillante qui menaçait un projet de pipeline en Alaska — un travail qui, selon lui, a fait économiser une fortune à l'entreprise. Il prend une retraite confortable, à peine quadragénaire.
Une boîte qui vous fait chanter juste
La retraite ne prend pas. Hildebrand avait étudié la musique sérieusement dans sa jeunesse, et il y revient peu à peu, fondant une petite société de logiciels audio qui deviendra Antares. La légende de ce qui suit est presque trop parfaite. Lors d'un dîner autour d'une conférence professionnelle, vers 1995, il demande à une tablée d'amis ce que quelqu'un devrait inventer, selon eux. Une femme, à moitié pour rire, répond : « Pourquoi tu ne fabriques pas une boîte qui me ferait chanter juste ? »
Il balaie l'idée d'un revers de main, la jugeant médiocre. Puis elle refuse de le lâcher. Parce que Hildebrand réalise qu'il sait déjà comment faire. Pour corriger la justesse d'un chanteur en temps réel, une machine doit accomplir une seule chose, très vite et très précisément : déterminer exactement quelle note la voix produit à l'instant présent. Or détecter la fréquence fondamentale d'une forme d'onde réelle et bruitée, c'était le même problème — mathématiquement le même problème — que lire la période d'un écho sismique.

Son pari décisif : utiliser l'autocorrélation pour la détection de hauteur plutôt que la transformée de Fourier, plus courante. L'autocorrélation examine toute la forme d'onde au lieu d'une poignée de caractéristiques extraites, ce qui la rendait plus robuste — mais aussi terriblement coûteuse à calculer. Le vrai génie de Hildebrand, ce fut la simplification. « J'ai réalisé que la majeure partie de l'arithmétique était redondante, et pouvait être simplifiée », racontera-t-il plus tard. « Ma simplification a transformé un million de multiplications-additions en seulement quatre. » C'est cet effondrement d'un million d'opérations à quatre qui a permis au système de tourner en temps réel, sur les ordinateurs modestes de 1996.
D'un outil discret à un son à part entière
L'Auto-Tune arrive fin 1996 et est dévoilé au salon NAMM de 1997, où il se répand à toute vitesse. Pendant deux ou trois ans, il fait exactement ce pour quoi il était prévu, en silence : il ramène les notes légèrement fausses au demi-ton le plus proche, si doucement que personne n'était censé s'en rendre compte. C'était un correcteur, un vérificateur d'orthographe pour l'audio.
Puis, en 1998, le titre « Believe » de Cher pousse la vitesse de correction à son réglage le plus extrême, et au lieu d'une retouche invisible on obtient ce basculement chevrotant et inhumain entre les notes. « L'effet secondaire » devient le but. T-Pain en a fait une carrière ; le hip-hop, la K-pop et la pop en général l'ont absorbé dans leur ADN. Un outil conçu pour être inaudible est devenu l'une des textures les plus reconnaissables de la musique enregistrée.

Le haussement d'épaules du mathématicien
Hildebrand a observé l'amour et la haine que suscite son invention avec le détachement amusé d'un ingénieur qui n'avait rien prémédité de tout ça. On lui reproche d'avoir « ruiné » le chant ; d'autres lui attribuent l'invention de toute une esthétique. Il écarte les deux avec la même phrase : « Parfois je dis aux gens : "J'ai juste construit une voiture, je ne l'ai pas conduite à contresens sur l'autoroute." »
La formule est nette, et elle fait mouche. Mais une vérité plus riche se cache en dessous, comme une couche de roche attendant le bon écho pour se révéler. Si la voix d'un chanteur peut être calée sur une grille parfaite, c'est qu'au fond, une note humaine et une strate pétrolifère ne sont que des signaux — des motifs périodiques attendant d'être mesurés. Andy Hildebrand a passé une décennie à apprendre aux machines à entendre la Terre. Quand il a tourné cette même oreille vers la voix humaine, l'industrie musicale n'a plus jamais sonné pareil.
