NhàTin tứcAI đang giảm mức sử dụng bộ nhớ như thế nào: Nhu cầu lưu trữ chuyển từ DRAM sang NAND

AI đang giảm mức sử dụng bộ nhớ như thế nào: Nhu cầu lưu trữ chuyển từ DRAM sang NAND

Cuộc khủng hoảng tiềm ẩn của DRAM & NAND: Thất bại trong việc lưu giữ dữ liệu trong kỷ nguyên AI |Độ tin cậy lưu trữ































Trong thời đại trí tuệ nhân tạo, chúng ta từ lâu đã tập trung vào sức mạnh, năng lực và tốc độ tính toán.Chúng tôi bổ sung thêm DRAM, xếp chồng HBM và mở rộng 3D NAND để hỗ trợ các mô hình lớn hơn và suy luận nhanh hơn.Nhưng một cuộc khủng hoảng thầm lặng, nguy hiểm đang xuất hiện: dữ liệu không còn có thể được lưu trữ một cách đáng tin cậy.

Khi AI phát triển từ AI tổng hợp sang AI tác nhân tự trị, các hệ thống yêu cầu trạng thái ổn định, trí nhớ dài hạn và ra quyết định liên tục.Họ không còn có thể chịu đựng được dữ liệu tạm thời hoặc không ổn định.Đồng thời, việc không ngừng mở rộng quy mô DRAM và NAND để đạt được mật độ cao hơn đang làm xói mòn nghiêm trọng khả năng lưu giữ dữ liệu và biên độ lỗi.

Thách thức cốt lõi của việc lưu trữ đã thay đổi: từ “chúng ta có thể lưu trữ nó không?”thành “chúng ta có thể giữ nó đúng cách không?”

Xu hướng cốt lõi: AI khiến độ tin cậy của bộ nhớ trở nên quan trọng

Hệ thống AI không còn là nhiệm vụ tính toán một lần nữa.AI tác nhân hiện đại dựa vào:

  • Trí nhớ dài hạn
  • Trạng thái hệ thống được duy trì
  • Ra quyết định tự chủ, liên tục

Điều này có nghĩa là việc lưu trữ phải duy trì dữ liệu chính xác theo thời gian, không chỉ làm việc trong một thời gian ngắn.Độ tin cậy đã trở thành yếu tố quyết định sự ổn định của cơ sở hạ tầng AI.

Nguyên nhân cốt lõi: Mở rộng quy mô làm giảm độ tin cậy

Cải thiện mật độ trực tiếp làm hỏng sự ổn định.Đây là một sự đánh đổi không thể tránh khỏi.

Dành cho NAND Flash

  • Thu nhỏ kích thước XY
  • Tăng lớp xếp chồng 3D
  • Kết quả: biên độ lỗi thấp hơn, mất phí dễ dàng hơn

Dành cho DRAM

  • Chuyển sang DRAM 3D
  • Kích thước tế bào nhỏ hơn
  • Kết quả: thời gian lưu ngắn hơn, khả năng chịu tiếng ồn thấp hơn

Quy tắc: Mật độ cao hơn = Độ tin cậy thấp hơn

Vấn đề cơ bản của NAND: Mất điện tích

Lỗi NAND tóm lại là mất phí, xảy ra theo hai cách chính:

  1. Rò rỉ điện tích dọc - điện tích thoát vào kênh
  2. Khuếch tán điện tích bên - điện tích lan truyền giữa các dòng từ

Thất bại duy trì ngắn hạn và dài hạn

  • Ngắn hạn: Bẫy nông, dịch chuyển điện áp ban đầu (IVS), thay đổi xuất hiện nhanh chóng
  • Dài hạn: Bẫy sâu, cơ chế kết hợp (TAT/DT/TE), vấn đề ngày càng phức tạp theo thời gian

Điểm yếu tiềm ẩn của DRAM: Nó cũng không thể “giữ” dữ liệu

DRAM không an toàn trước lỗi lưu giữ.Nó bị nhiều đường dẫn rò rỉ:

  • Tụ điện rò rỉ
  • Đường hầm trực tiếp
  • Rò rỉ dưới ngưỡng & GIDL
  • Rò rỉ mối nối

Sự thay đổi cơ bản trong lưu trữ

quá khứ: Dung lượng = dung lượng + tốc độ, Đã sửa lỗi với ECC

bây giờ: Lưu trữ = độ tin cậy lâu dài + tính nhất quán trạng thái, Lưu trữ là nền tảng cho sự ổn định của hệ thống

Kết luận

Cuộc khủng hoảng thực sự trong kỷ nguyên AI không phải là sức mạnh tính toán không đủ – mà là lưu giữ dữ liệu không đáng tin cậy.

Khi 3D NAND và DRAM mở rộng quy mô sang hình học nhỏ hơn và mật độ cao hơn, tình trạng thất thoát điện tích và rò rỉ sẽ trầm trọng hơn.Nhu cầu về bộ nhớ liên tục của AI càng làm tăng thêm những sai sót này.

Để xây dựng các hệ thống AI ổn định cấp doanh nghiệp, ngành phải chuyển trọng tâm từ tốc độ và công suất sang khả năng duy trì, kiểm soát sạc và độ tin cậy lâu dài.