Les marchés américains d'avril ont été plongés dans une fête structurelle dominée par l'IA, le Nasdaq ayant bondi de 15,3 % en un seul mois, le S&P 500 de 10,4 %, et l'indice des semi-conducteurs de Philadelphie ayant enregistré la plus forte hausse mensuelle depuis 2000. Après mai, le scénario du marché a rapidement changé, avec les trois grands indices américains oscillant à des niveaux élevés, sous une apparence de calme apparent, des courants souterrains tumultueux : ARM a vu son cours s'envoler de 42,58 % en une semaine grâce à ses résultats financiers, tandis que des leaders du stockage comme SanDisk et Seagate ont tous deux augmenté de plus de 15 % en une semaine, alors que des anciens leaders de l'IA comme Nvidia et Microsoft ont vu leurs cours baisser.

S'agit-il d'une défaillance de la tendance principale de l'IA ou d'une transition interne profonde ? Les fonds migrent des GPU et des géants du cloud vers l'architecture ARM et les puces de stockage, le marché semblant négocier une nouvelle logique : « sommet de la puissance de calcul d'entraînement, inférence en périphérie et stockage en relais ». La Dow Jones a atteint de nouveaux sommets, cela signifie-t-il que la rotation de style a commencé ? La forte hausse d'ARM marque-t-elle le début d'une réévaluation de la valeur ou le sommet d'une bulle à court terme ?

Points clés :

La fièvre de l'IA n'est pas terminée, mais elle entre dans une phase de différenciation fine : les fonds continuent d'affluer dans le domaine de l'IA, mais la tendance générale s'est transformée en investissements sélectifs. L'intérieur du marché voit des flux de GPU et de géants du cloud vers l'architecture ARM et les puces de stockage, la logique de négociation changeant en « sommet de la puissance de calcul d'entraînement, inférence en périphérie et stockage en relais ».
L'effet de regroupement des fonds est fort, mais le groupe change : la négociation quantitative, les options de fin de cycle et les ETF à effet de levier ont modifié l'écosystème du marché, l'activité de couverture des market makers renforçant la volatilité. L'effet de regroupement n'a pas disparu, mais il s'est déplacé de Nvidia vers de nouveaux points chauds comme ARM et SanDisk, provoquant des hausses « à faire perdre la tête ».
La hausse d'ARM est typique d'une opération de short squeeze, non soutenable : la compression gamma et la compression des vendeurs à découvert se superposent, entraînant une envolée à court terme du prix de l'action. Ce type de mouvement ne peut pas durer éternellement, et si la demande d'achat s'épuise ou si l'émotion vacille, le prix peut rapidement se retourner à la baisse, nécessitant une vigilance extrême.
L'architecture ARM possède un avantage intrinsèque pour l'inférence en périphérie : en tant que RISC (jeu d'instructions réduit), ARM a une efficacité énergétique près de deux fois inférieure à celle de x86 ; le mode de licence IP permet une conception personnalisée et hétérogène ; l'optimisation des opérations matricielles est mieux adaptée aux modèles Transformer. Un point d'inflexion à long terme s'est formé dans l'industrie, mais la volatilité à court terme est forte.
La position de Nvidia dans l'inférence reste solide, mais elle fait face à des défis : la barrière écologique de CUDA est difficile à franchir, et aucun concurrent sérieux n'a encore émergé pour la phase d'entraînement. Cependant, dans l'inférence, des acteurs comme AMD, Google et Microsoft développent leurs propres puces, bénéficiant de l'aspiration générale à réduire la dépendance à Nvidia, ce qui pourrait réduire sa part de marché à l'avenir, tout en restant le leader.
La charge de calcul d'inférence dépasse celle de l'entraînement, représentant désormais 70-80 % : actuellement, la charge de travail d'inférence et d'entraînement est d'environ 6:4, mais les dépenses d'investissement (Capex) restent concentrées à 60 % sur l'entraînement. Avec la diffusion des grands modèles et le développement de l'IA agentique, ainsi que le ralentissement des itérations d'entraînement, les exigences strictes en matière de coûts, de consommation d'énergie et de latence pour l'inférence offrent de nouvelles opportunités pour ARM et les puces de stockage.

Revue du marché : La fête dominée par l'IA est-elle le début ou une bulle ?

Sun Cheng : La vague de hausse dominée par l'IA est-elle terminée ? Les fonds migrent des GPU / géants du cloud vers ARM et le stockage, quelle est la force motrice derrière cela ?

Maojie : Depuis 2023, le marché américain a déjà commencé à se concentrer sur l'IA. La star de toute l'année 2023 a été Nvidia, qui appartient au secteur des semi-conducteurs, mais dont la principale force motrice est l'IA. Cette vague de marché a duré depuis lors jusqu'en 2024, 2025, et se manifeste maintenant par une croissance segmentée et rythmée. Donc, il est encore prématuré de dire que la fièvre de l'IA est terminée.

D'après nos dernières données de surveillance du marché américain de vendredi dernier, les flux vers le domaine de l'IA ne montrent aucun signe de faiblesse. Mais il y a une caractéristique notable : une « différenciation dans la différenciation ». Depuis octobre dernier, le marché américain est en stagnation, avec une consolidation horizontale de octobre à février. Pendant cette période, certaines actions de logiciels et de grandes tech impactées par l'IA ont montré des signes de fatigue ou de correction. Cependant, durant cette même période, certains secteurs populaires liés à l'IA, comme le stockage et la communication optique, n'ont pas seulement résisté, mais ont progressé, illustrant la différenciation du marché et la concentration des fonds.

Ainsi, selon nos observations, que ce soit pour de nouveaux acheteurs ou pour les investisseurs existants, l'enthousiasme reste élevé. Mais le marché montre une tendance continue : à l'intérieur du grand secteur de l'IA, les fonds cherchent constamment de nouveaux points chauds, des différenciations, de nouveaux thèmes et des entreprises dans différentes filières. Par conséquent, la vague de hausse n'est pas terminée, mais elle entre dans une phase plus fine et segmentée.

Sun Cheng : Le Nasdaq et le S&P 500 ont enregistré leurs meilleures performances mensuelles en près de six ans, et l'indice des semi-conducteurs de Philadelphie a connu sa plus forte hausse mensuelle depuis 2000. Derrière cette extrême volatilité, en plus de l'IA, quels aspects spécifiques reflètent la restauration de l'humeur du marché et l'effet de regroupement des fonds ? Après la mi-mai, le marché n'a pas continué à monter en général, cela signifie-t-il que l'humeur du marché est passée d'« optimisme global » à « investissements sélectifs » ? L'effet de regroupement existe-t-il toujours ?

Maojie : Cela peut s'analyser sous deux angles. D'une part, il s'agit d'une tendance technique typique du marché américain. En général, après une longue période de stagnation ou de baisse, le marché américain connaît une reprise violente, comme en 2020 ou après la correction de août à octobre 2023, suivie d'une hausse quasi continue de près de six mois. Depuis octobre dernier, le marché américain est en stagnation, avec une stabilité de ses niveaux de prix pendant plusieurs mois, ce qui est une consolidation typique. La dernière chute de mars a été une correction sévère des valorisations, le 30 mars étant considéré comme le point bas de cette phase. Par conséquent, la forte hausse d'avril est essentiellement une correction de cette consolidation de près de six mois. La caractéristique principale du marché américain est de « rester dans le jeu » : il faut rester investi, car la reprise peut se produire en un ou deux jours. Selon nos statistiques, que ce soit sur 50, 30 ou 10 ans, manquer ces quelques journées ou semaines de rebond ou de forte hausse peut faire une différence considérable dans le rendement annuel.

D'autre part, l'effet de regroupement des fonds persiste, mais le marché est très différent de celui d'avant. La négociation quantitative, le trading algorithmique, la participation massive des petits investisseurs et l'abondance d'options et d'ETF à effet de levier ont profondément modifié l'écosystème du marché. Les market makers, pour couvrir leurs risques, doivent adopter certains comportements qui amplifient la hausse ou la baisse. En particulier, dans le cas des actions phares de l'IA, tous les petits investisseurs achètent des options de fin de cycle, tandis que les gros acteurs (avec des fonds importants et une influence sur le marché) poursuivent ces points chauds. Cela accélère la hausse et la baisse, renforçant l'effet de regroupement des fonds, qui devient de plus en plus fort, avec des phénomènes « à faire perdre la tête ». Par conséquent, le marché ne passe pas d'un optimisme à un pessimisme, mais le groupe d'investissement change simplement, les fonds restant concentrés, mais sur d'autres actifs.

Sun Cheng : La hausse de plus de 42 % d'ARM en une semaine, en seulement deux jours de trading, est-elle déjà une opération de « squeeze » ? La psychologie des petits investisseurs ou la compression gamma des options y ont-elles contribué ? Une telle vitesse de hausse peut-elle être soutenue ?

Maojie : C'est effectivement une opération de squeeze très typique, où l'effet gamma joue un rôle clé. Sur le marché américain actuel, lorsqu'un point chaud apparaît, toutes les institutions, gros investisseurs et petits investisseurs se précipitent. La présence massive d'options de fin de cycle entraîne un effet gamma. La plupart des market makers ne parient pas sur la direction, mais cherchent à réaliser des marges via le spread. Lorsque la majorité des acteurs achètent des options de fin de cycle ou des options d'achat hors du cours, les market makers font face à un risque énorme : si le prix de l'action monte, ils doivent couvrir leur position en achetant des actions sous-jacentes pour neutraliser leur delta. Plus il y a d'acheteurs, plus ils doivent acheter d'actions, ce qui pousse le prix vers le haut de façon folle. Nous avons récemment observé cet effet dans les 30 dernières minutes de trading, qui est souvent dû à cette compression gamma. En voyant le prix monter encore et encore, les investisseurs excités continuent d'acheter des options d'achat, ce qui pousse encore plus les market makers à acheter des actions pour couvrir leur position.

Il y a aussi la compression des vendeurs à découvert : certains investisseurs pensent que le prix s'écarte fortement de la valeur, et prennent des positions short, mais face à cette dynamique, ils sont contraints de couvrir leurs positions en achetant des actions, ce qui crée une pression haussière supplémentaire. Sur ARM, si cette tendance dure plus longtemps ou si la pente devient plus raide, cela pourrait devenir un squeeze classique.

Concernant la soutenabilité, cette tendance ne peut pas durer éternellement d'un point de vue technique. Une fois que tous les vendeurs à découvert ont capitulé ou que la confiance des nouveaux acheteurs est ébranlée par la volatilité, le marché perd ses amortisseurs, et le prix peut rapidement se retourner à la baisse lors d'une prise de bénéfices ou d'une hésitation du marché, avec un effet de superposition similaire à celui de la hausse. Par conséquent, il faut faire preuve d'une extrême prudence face à ce type de mouvement.

Analyse approfondie de la technologie IA : montée d'ARM, pression sur Nvidia, relais dans le stockage

Sun Cheng : ARM a connu une hausse de 42,58 % la semaine dernière, le scénario central étant « l'IA passant de l'entraînement à l'inférence en périphérie, l'architecture ARM bénéficiant largement ». Pouvez-vous analyser d'un point de vue technique : en quoi l'ensemble d'instructions et le mode de licence d'ARM offrent-ils des avantages essentiels dans le contexte de l'inférence IA par rapport à x86 ? Cette nouvelle valorisation est-elle catalysée par des résultats financiers à court terme ou par un point d'inflexion à long terme dans l'industrie ?

Wang Huai : Sur le plan technique, la tendance actuelle vers une application de puissance de calcul IA centrée sur l'inférence en périphérie est très claire. L'ARM est plus adapté que x86 pour le cœur de cette application pour trois raisons principales :

Premièrement, l'avantage de l'ensemble d'instructions. ARM est basé sur RISC (jeu d'instructions réduit), tandis que x86 est basé sur CISC (jeu d'instructions complexe). RISC n'a pas besoin d'une conception de pipeline aussi complexe, ce qui permet d'intégrer plus de cœurs, de cache ou d'unités d'accélération spécialisées dans la même surface de puce, facilitant le calcul proche de la mémoire. Dans l'inférence IA, un goulot d'étranglement majeur est la communication mémoire. ARM possède une IP physique flexible et une capacité de personnalisation, ce qui le rend naturellement adapté aux calculs d'inférence IA. Dans des charges typiques en périphérie, l'efficacité énergétique d'ARM est nettement supérieure à celle de x86, avec une consommation d'énergie souvent inférieure de près de 50 %, offrant un avantage considérable en termes de coûts.

Deuxièmement, l'avantage du mode de licence IP. ARM fonctionne par licence IP, permettant aux clients de faire des designs personnalisés après obtention de la licence, par exemple en intégrant CPU, GPU, NPU de manière cohérente. En revanche, x86 est une « boîte noire » difficile à modifier pour des optimisations hétérogènes. Cette ouverture facilite la conception de mémoire à large bande passante (LPDDR) intégrée, ce qui est très recherché.

Troisièmement, l'optimisation des opérations matricielles. Les modèles Transformer utilisent massivement des multiplications matricielles, et l'optimisation sur ARM est beaucoup plus efficace que sur x86. Bien que x86 puisse également faire des multiplications matricielles efficacement, atteindre la même efficacité énergétique et la même efficacité de surface n'est pas aussi rentable sur ARM, notamment en périphérie. Si la compatibilité et la maturité comptent, x86 est une option, mais si l'on privilégie le rapport coût-efficacité et la consommation d'énergie (futurs coûts importants), ARM a un avantage évident.

Du point de vue des tendances industrielles, l'IA passe de l'entraînement à l'inférence, notamment dans le développement de l'IA agentique. Cela ne concerne pas seulement la conversation avec de grands modèles, mais aussi de nombreux appels API, des interactions réseau et des accès aux fichiers, qui dépendent tous du CPU. En tant que CPU, ARM est très attendu dans les applications d'IA agentique en périphérie (PC, mobile, automobile, etc.). Je pense que la direction générale est correcte, le point d'inflexion industriel est reconnu. Mais à court terme, la volatilité des prix sera forte, tandis qu'à long terme, ces grandes orientations renforceront la valeur. Le long terme est une balance, le court terme un vote émotionnel.

Sun Cheng : Nvidia a chuté de 2,58 % la semaine dernière, le marché craignant un ralentissement de sa croissance. AMD a augmenté de 3,60 %. La barrière écologique de CUDA chez Nvidia reste-t-elle solide dans le domaine des puces IA ? Les GPU MI d'AMD peuvent-ils réduire l'écart en inférence ? La R&D interne de puces par les clients représente-t-elle une menace importante pour Nvidia ?

Wang Huai : Sur le plan de l'entraînement, personne ne peut actuellement concurrencer Nvidia. Mais avec la diffusion des grands modèles et le développement de l'IA agentique, la demande en puissance de calcul pour l'inférence augmente fortement, offrant des opportunités à d'autres acteurs. La demande en inférence est plus complexe, nécessitant une conception conjointe de CPU, GPU, NPU, avec des exigences élevées en mémoire. Cela permet à AMD et à d'autres de prendre leur part.

AMD bénéficiera certainement de l'aspiration générale à « en avoir assez de Nvidia » dans l'inférence. Les entreprises ont besoin d'un second fournisseur fiable pour assurer la sécurité de la chaîne d'approvisionnement, afin d'éviter d'être dépendantes d'un seul fournisseur. Dès qu'un second fournisseur viable apparaît, les clients lui accorderont une préférence supplémentaire. La croissance du secteur des centres de données d'AMD est notable, mais le chiffre d'affaires global reste bien inférieur à la hausse du cours de l'action, ce qui reflète aussi une certaine volatilité émotionnelle, mais la véritable opportunité dans l'inférence est réelle.

Pour Nvidia, ses ventes en inférence seront affectées, mais pas de façon fatale. La barrière de CUDA ne sera pas franchie facilement en un jour ou deux. Par ailleurs, Google, Microsoft et Amazon développent leurs propres puces d'inférence, pour réduire leur dépendance à un seul fournisseur et pour faire des designs hétérogènes sur mesure pour leurs scénarios spécifiques. Cette tendance est claire. Mais la puce la plus universelle et la plus polyvalente reste Nvidia. Dans les deux ou trois prochaines années, même dans l'inférence, Nvidia conservera une part de marché dominante, mais la concentration sera moins forte qu'en entraînement. Sur le court terme, il n'y a pas de concurrent sérieux dans l'entraînement.

Sun Cheng : La tendance du marché indique que l'investissement dans l'IA passe du « calcul d'entraînement » à « l'inférence ». Selon les déploiements actuels, quelle est la proportion approximative de charge de travail IA consacrée à l'entraînement et à l'inférence ? Comment cette proportion évoluera-t-elle dans deux ans ? Ce changement pose-t-il de nouveaux défis technologiques en matière de conception de puces, de bande passante mémoire, de consommation d'énergie ?

Wang Huai : D'après certains rapports, la charge de travail d'inférence représente environ 60-55 % (6:4 ou 5,5:4,5) du total, l'inférence ayant dépassé l'entraînement. Mais les investissements (Capex) sont inverses : l'entraînement représente encore 60 %, l'inférence 40 %, car l'entraînement nécessite des coûts de super-nœuds plus élevés.

À l'avenir, la part de l'inférence augmentera considérablement. D'une part, la diffusion des grands modèles dans le monde est encore faible : 86 % de la population mondiale n'a jamais utilisé de grands modèles. En dehors de la Chine et des États-Unis, de nombreux pays ont peu d'applications de grands modèles. D'autre part, l'IA agentique va considérablement augmenter le nombre d'appels aux grands modèles. Dans trois à cinq ans, il est tout à fait possible que la part de l'inférence atteigne 70-80 %.

Une autre raison est que la vitesse d'itération de l'entraînement ralentit fortement. Les entreprises capables de faire de grands modèles se concentrent de plus en plus, et peu d'entreprises peuvent supporter les coûts d'entraînement. Avec la réduction de la concurrence, les entreprises préfèrent monétiser leurs modèles existants plutôt que de lancer rapidement de nouveaux modèles. La demande en puissance de calcul pour l'entraînement diminue donc. À moins qu'il n'y ait une percée majeure dans des domaines comme l'intelligence incarnée ou les modèles du monde, cela pourrait devenir un nouveau facteur.

Ce passage de l'entraînement à l'inférence impose des exigences techniques accrues pour la conception des puces. L'inférence est très sensible aux coûts, à la consommation d'énergie et à la latence, tout en devant s'adapter à une variété de scénarios du cloud à la périphérie, ce qui offre des opportunités pour différentes architectures (GPU, ASIC, CPU). La bande passante mémoire et le cache contextuel (KV Cache) sont également plus exigeants que pour l'entraînement. Ces défis technologiques offrent justement plus d'opportunités pour des architectures comme ARM et pour les puces de stockage.

NAS100-0,08%

SPYX0,13%

ARM6,45%

SNDK0,5%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

Ajouter un commentaire

Aucun commentaire

Sujets populaires
Afficher plus
#
WinGoldBarsWithGrowthPoints
1.22M Popularité
#
WTICrudeFallsBelow90Dollars
1.18M Popularité
#
IsraelStrikesIranBTCPlunges
51.36K Popularité
#
StockTradingChallengeUpTo17000U
187.86K Popularité
#
USIranNegotiationGame
9.41M Popularité

Épinglé

Quand la tendance "Vive les puces" du marché boursier américain prendra-t-elle fin

Points clés :

Revue du marché : La fête dominée par l'IA est-elle le début ou une bulle ?

Analyse approfondie de la technologie IA : montée d'ARM, pression sur Nvidia, relais dans le stockage

Sujets populaires

WinGoldBarsWithGrowthPoints

WTICrudeFallsBelow90Dollars

IsraelStrikesIranBTCPlunges

StockTradingChallengeUpTo17000U

USIranNegotiationGame

Épinglé