Nhà phân tích Zeitgeist cho biết nhu cầu đối với chip nhớ được sử dụng trong trí tuệ nhân tạo vượt xa năng lực sản xuất chip nhớ toàn cầu hiện tại theo bội số lớn, hàm ý rằng cổ phiếu của các nhà sản xuất bộ nhớ có thể tăng gấp mười lần nếu được định giá dựa trên nhu cầu tính toán thực tế thay vì các mức đỉnh lịch sử. Zeitgeist đưa ra một ví dụ đầu tư: 50.000 USD mua cổ phiếu Micron vào tháng 9 năm ngoái sẽ có giá trị xấp xỉ 489.000 USD hôm nay. Nhà phân tích cho rằng sự mất cân bằng cung-cầu xuất phát từ các giới hạn cố định của bộ nhớ băng thông cao (HBM) trong các bộ tăng tốc AI và việc áp dụng nhanh chóng các tác nhân AI tiêu thụ nhiều bộ nhớ hơn đáng kể mỗi phiên so với các chatbot truyền thống; sự thay đổi này diễn ra trong bối cảnh sản xuất bộ nhớ tăng chậm hơn so với tốc độ tăng trưởng nhu cầu sử dụng.
Các bộ tăng tốc AI đối mặt với giới hạn bộ nhớ cố định
Mỗi bộ tăng tốc AI được trang bị một lượng bộ nhớ tốc độ cao cố định và không thể mở rộng sau khi triển khai. Theo Zeitgeist, một chip H100 tiêu chuẩn mang 80 GB HBM, các thế hệ mới hơn cung cấp tới 192 GB và B300 trong tương lai sẽ có 288 GB. Mức trần này quyết định một bộ tăng tốc có thể xử lý đồng thời bao nhiêu yêu cầu.
Nhà phân tích giải thích rằng tải bộ nhớ chính không đến từ trọng số mô hình mà từ KV cache—bộ nhớ phiên tăng lên theo từng token được tạo. Zeitgeist tính rằng một phiên có ngữ cảnh 128.000 token cần khoảng 20 GB bộ nhớ, nghĩa là chỉ bốn phiên như vậy sẽ tiêu hao hết toàn bộ tài nguyên của một H100. Các mô hình tiên tiến như Claude Opus 4.8 hoặc GPT-5.5 cần 40 GB đến 100 GB cho một yêu cầu dài duy nhất, theo nhà phân tích.
Nhà phân tích tính thiếu hụt bộ nhớ 60 lần do việc áp dụng tác nhân
Zeitgeist xác định sự chuyển dịch từ chatbot đơn giản sang các tác nhân AI là động lực chính làm nhu cầu bộ nhớ tăng. Trong khi một câu hỏi thông thường tạo ra gánh nặng bộ nhớ ở mức tối thiểu, một tác nhân có thể tự động gọi công cụ và tích lũy ngữ cảnh có thể dễ dàng đạt 100.000 token trở lên. Nhà phân tích tính rằng một người làm tri thức chạy song song mười tác nhân như vậy sẽ cần khoảng 152 GB bộ nhớ.
Zeitgeist cho biết có khoảng 250 triệu người làm tri thức trên toàn thế giới. Nhà phân tích ước tính rằng với 100 phiên tác nhân theo người mỗi ngày, thế giới sẽ cần gần 60 lần bộ nhớ nhiều hơn so với lượng bộ nhớ sẽ được sản xuất vào năm 2026. Zeitgeist thừa nhận các phương pháp chú ý mới có thể giảm mức tiêu thụ bộ nhớ từ 4 đến 8 lần, nhưng cho biết nhu cầu đang tăng nhanh hơn vì các tác nhân thay thế các cuộc trò chuyện đơn giản, cửa sổ ngữ cảnh mở rộng từ 128.000 lên 10 triệu token, và mức sử dụng AI của mỗi người dùng chuyển từ 0 lên hàng trăm phiên.
SK Hynix vượt Samsung khi nhu cầu bộ nhớ cho AI bùng nổ
Nhà sản xuất bộ nhớ Hàn Quốc SK Hynix đã vượt Samsung để trở thành công ty niêm yết có giá trị cao nhất tại quốc gia này, nhờ vị thế của hãng trong các chip HBM băng thông cao được dùng cho các tác vụ trí tuệ nhân tạo. Zeitgeist cho biết sự thay đổi này củng cố luận điểm rằng các nhà sản xuất bộ nhớ đang trở thành bên hưởng lợi chính trong cuộc đua hạ tầng AI, với các công ty có khả năng sản xuất các chip nhớ tiên tiến được định vị để chứng kiến doanh thu và định giá tăng mạnh khi nhu cầu HBM tăng nhanh hơn so với nguồn cung.
FAQ
Nhà phân tích Zeitgeist đã nói gì về định giá cổ phiếu chip nhớ?
Zeitgeist cho biết cổ phiếu của các nhà sản xuất bộ nhớ có thể tăng gấp mười lần so với các mức hiện tại nếu được định giá dựa trên nhu cầu tính toán thực tế thay vì các đỉnh lịch sử, dẫn chứng rằng nhu cầu bộ nhớ cho AI vượt xa năng lực sản xuất toàn cầu theo bội số lớn.
Một phiên tác nhân AI cần bao nhiêu bộ nhớ theo Zeitgeist?
Zeitgeist tính rằng một phiên có ngữ cảnh 128.000 token cần khoảng 20 GB bộ nhớ, trong khi các mô hình tiên tiến như Claude Opus 4.8 hoặc GPT-5.5 cần từ 40 GB đến 100 GB cho một yêu cầu dài duy nhất. Nhà phân tích ước tính rằng một người làm tri thức chạy song song mười phiên tác nhân sẽ cần khoảng 152 GB bộ nhớ.