Supply chain des semiconducteurs — pourquoi votre GPU vient de partout sauf de chez vous

Chaque puce IA traverse plusieurs pays et monopoles techniques avant d'atterrir dans un datacenter. Un regard sur les dépendances géographiques et technologiques qui conditionnent l'accès aux GPU.

En bref

Un GPU H100 ne naît pas dans un seul pays. Sa conception est californienne, sa gravure taïwanaise, son assemblage de nouveau taïwanais, sa mémoire coréenne, ses machines de lithographie néerlandaises. La chaîne qui produit les puces alimentant les modèles d’IA est géographiquement concentrée, techniquement fragile, et difficile à dupliquer. Comprendre cette chaîne, c’est comprendre pourquoi “commander 10 000 GPU” ne suffit pas à garantir leur livraison.

Une chaîne découpée en couches

La production d’un semiconducteur ne ressemble pas à une ligne d’assemblage automobile. Elle est fragmentée en spécialités distinctes, chacune dominée par un petit nombre d’acteurs.

Les concepteurs (fabless) — Nvidia, AMD, Apple, Qualcomm — conçoivent les puces sans posséder d’usines. Ils produisent des plans au niveau du nanomètre, que des logiciels spécialisés (EDA) traduisent en instructions de fabrication.

Les fonderies (foundries) fabriquent ces puces à la commande. TSMC, Samsung Foundry et Intel Foundry sont les acteurs principaux. Ils n’inventent pas les puces : ils les gravent dans le silicium selon les plans fournis.

Les équipementiers produisent les machines sans lesquelles aucune fonderie ne peut fonctionner. ASML (Pays-Bas) occupe une position unique : c’est le seul fabricant mondial de machines à lithographie EUV, indispensables pour les nœuds les plus fins.

Les fournisseurs de matériaux complètent la chaîne : silicium ultrapure, gaz spéciaux, photorésines — souvent produits par des entreprises japonaises.

Le nœud de fabrication : mesurer la finesse

Un “nœud” désigne la finesse de gravure des transistors. Plus le chiffre est petit, plus les transistors sont denses et efficaces. Le N4 de TSMC (environ 4 nm) est utilisé pour les GPU H100 de Nvidia. Le N3 (3 nm) équipe les puces Apple récentes. Le N2 (2 nm) est en production depuis 2025.

Ce chiffre n’est pas juste un indicateur de performance — c’est une barrière à l’entrée. Maîtriser un nouveau nœud prend des années et coûte des dizaines de milliards. TSMC produit environ 90 % des puces les plus avancées (en dessous de 7 nm) à l’échelle mondiale, selon le rapport SIA 2023. Taïwan concentre environ 63 % de la capacité mondiale sur ces nœuds.

ASML : le monopole discret

Pour graver des motifs à quelques nanomètres, les fonderies utilisent la lithographie EUV (Extreme Ultraviolet). Ces machines projettent une lumière à 13,5 nm de longueur d’onde pour imprimer des circuits minuscules dans le silicium.

ASML est le seul fabricant mondial de ces équipements. Une machine EUV standard coûte entre 150 et 200 millions d’euros. La génération suivante — le High-NA EUV (modèle EXE:5000) — atteint 380 millions d’euros l’unité. Ces machines contiennent plus de 100 000 composants, fabriqués par environ 800 sous-traitants. Leur duplication à court terme est quasi impossible.

ASML a livré ses premières machines High-NA à Intel et TSMC en 2024. Ce nouveau monopole conditionne la production des nœuds sub-2 nm pour la prochaine décennie.

CoWoS : quand l’emballage devient le goulot

Un aspect moins visible de la chaîne a créé les pires pénuries GPU en 2023 : le packaging avancé.

Un GPU H100 n’est pas une puce unique. C’est un assemblage : le die principal (gravé en N4 chez TSMC), auquel on soude de la mémoire HBM3E (High Bandwidth Memory, produite par SK Hynix en Corée du Sud). Cette soudure en 2.5D s’appelle le CoWoS (Chip-on-Wafer-on-Substrate). Elle se fait dans des usines spécialisées — encore majoritairement chez TSMC.

En 2023, Nvidia pouvait graver suffisamment de dies H100. Le problème était ailleurs : pas assez de capacité CoWoS pour les assembler. Les délais de livraison ont atteint 12 à 18 mois. TSMC a depuis investi massivement pour tripler cette capacité, mais la montée en volume est lente : le CoWoS nécessite des équipements dédiés et un savoir-faire spécifique.

En 2024-2025, un second bottleneck s’est ajouté : la mémoire HBM3E. SK Hynix détient plus de 50 % du marché, Samsung 35 %, Micron 15 %. La capacité de production HBM est contrainte par des processus de fabrication complexes qui ne s’accélèrent pas facilement.

Géopolitique : quand les cartes comptent autant que les brevets

Cette concentration géographique a une dimension stratégique évidente. Le rapport BCG/SIA de 2021 a estimé qu’une interruption totale de l’approvisionnement depuis Taïwan coûterait plusieurs milliers de milliards de dollars et provoquerait un effondrement de la production électronique mondiale en 6 à 12 mois.

Cette vulnérabilité a déclenché des réponses politiques massives.

Le CHIPS and Science Act américain (août 2022, 52,7 milliards de dollars) finance des usines TSMC à Phoenix (Arizona), Samsung à Taylor (Texas) et Intel en Ohio. Les premières productions sur nœuds avancés aux États-Unis sont attendues entre 2025 et 2027. Mais ces usines produisent du N4, pas du N3 — avec deux à trois ans de retard sur les sites taïwanais.

L’EU Chips Act (43 milliards d’euros) vise 20 % de la production mondiale d’ici 2030, un objectif jugé très ambitieux par la majorité des analystes du secteur.

Le Japon a subventionné une usine TSMC à Kumamoto, opérationnelle en 2024 sur des nœuds matures (N12/N16), et négocie une seconde fab pour les nœuds plus avancés.

Face à cela, les contrôles à l’export américains (2022-2024) ont interdit à ASML de livrer des machines EUV à la Chine, et restreint les équipements Applied Materials, Lam Research et KLA. La Chine continue son rattrapage sur les nœuds matures (28 nm et plus), mais reste bloquée sur les nœuds avancés.

Ce que les subventions ne peuvent pas acheter

Construire une usine prend 5 à 7 milliards de dollars et plusieurs années. La rendre productive en est une autre affaire.

Le vrai avantage de TSMC n’est pas dans ses machines — qui peuvent être achetées par d’autres — mais dans son rendement de production (yield) : le pourcentage de puces fonctionnelles sortant d’un lot. Ce savoir-faire s’accumule sur des décennies. Une nouvelle fab avec les mêmes équipements ASML obtiendra des yields bien inférieurs pendant 3 à 5 ans.

Le talent est l’autre frein. TSMC a rencontré des difficultés à recruter suffisamment d’ingénieurs taïwanais pour ses sites américains, ce qui a décalé les calendriers de production. Le knowhow humain se transfère plus lentement que le béton.

Une étude du MIT (Finkenrath et al., 2023) suggère que les subventions actuelles seraient insuffisantes d’un facteur 3 à 4 pour atteindre une véritable autonomie sur les nœuds avancés — bien que ce chiffre reste débattu et que l’accès direct au papier n’ait pas été confirmé.

Ce qu’il faut retenir

La production des puces IA les plus avancées est concentrée à 90 % à Taïwan et Corée du Sud, avec des équipements clés produits aux Pays-Bas.
ASML détient un monopole absolu sur la lithographie EUV et High-NA EUV, indispensable pour les nœuds sub-3 nm.
Les pénuries GPU de 2023-2024 n’étaient pas dues à un manque de capacité de gravure, mais à un goulot dans le packaging avancé (CoWoS) — une étape distincte dans la chaîne.
La mémoire HBM3E est un second bottleneck, dominé par SK Hynix, qui conditionne les performances des GPU IA.
Les CHIPS Acts américain et européen cherchent à diversifier cette chaîne, mais le yield de production et le capital humain constituent des barrières que les subventions ne compensent pas à court terme.