Header Ads

  • Breaking News

    Chip AI phá vỡ nút thắt cổ chai von Neumann với xử lý mạng thần kinh trong bộ nhớ

    Kiến trúc von Neumann, vốn là một thiết yếu trong kiến ​​trúc máy tính, có thể sớm thấy mình kém hữu ích hơn trong thế giới trí tuệ nhân tạo.
    Kiến trúc máy tính là một lĩnh vực rất năng động đã phát triển đáng kể kể từ khi thành lập.
    Trong số tất cả những thay đổi và đổi mới trong lĩnh vực này kể từ những năm 1940, một khái niệm vẫn còn nguyên vẹn và không thể tách rời: Kiến trúc von Neumann. Gần đây, với sự phát triển vượt bậc của trí tuệ nhân tạo, các kiến ​​trúc sư đang bắt đầu phá vỡ khuôn mẫu và thách thức nhiệm kỳ của von Neumann. 
    Cụ thể, hai công ty đã hợp tác để tạo ra một con chip AI thực hiện các phép tính mạng nơ-ron trong bộ nhớ phần cứng. 

    Kiến trúc von Neumann 

    Kiến trúc von Neumann lần đầu tiên được giới thiệu bởi John von Neumann trong bài báo năm 1945 của ông, “ Bản thảo đầu tiên của một báo cáo về EDVAC .” Nói một cách đơn giản, kiến ​​trúc von Neumann là một trong đó các hướng dẫn chương trình và dữ liệu được lưu trữ cùng nhau trong bộ nhớ để sau này được hoạt động trên. 

    Kiến trúc von Neumann
    Kiến trúc von Neumann. Hình ảnh được sử dụng với sự cung cấp của NC Lab

    Có ba thành phần chính trong kiến ​​trúc von Neumann : CPU, bộ nhớ và các giao diện I / O. Trong kiến ​​trúc này, CPU phụ trách tất cả các tính toán và điều khiển luồng thông tin, bộ nhớ được sử dụng để lưu trữ dữ liệu và lệnh, và giao diện I / O cho phép bộ nhớ giao tiếp với các thiết bị ngoại vi. 
    Khái niệm này có vẻ hiển nhiên đối với các kỹ sư bình thường, nhưng đó là bởi vì khái niệm này đã trở nên phổ biến đến mức hầu hết mọi người không thể hiểu được một máy tính hoạt động theo cách khác.
    Trước đề xuất của von Neumann, hầu hết các máy sẽ chia bộ nhớ thành bộ nhớ chương trình và bộ nhớ dữ liệu . Điều này làm cho các máy tính rất phức tạp và hạn chế khả năng hoạt động của chúng. Ngày nay, hầu hết các máy tính sử dụng khái niệm kiến ​​trúc von Neumann trong thiết kế của họ.

    Nút thắt cổ chai Von Neumann

    Một trong những nhược điểm lớn của kiến ​​trúc von Neumann là cái được gọi là nút cổ chai von Neumann. Vì bộ nhớ và CPU được tách biệt trong kiến ​​trúc này, nên hiệu suất của hệ thống thường bị giới hạn bởi tốc độ truy xuất bộ nhớ. Về mặt lịch sử, tốc độ truy cập bộ nhớ chậm hơn nhiều so với tốc độ xử lý thực tế , tạo ra tắc nghẽn trong hiệu suất hệ thống.
    Hơn nữa, chuyển động vật lý của dữ liệu tiêu tốn một lượng năng lượng đáng kể do các ký sinh trùng liên kết với nhau. Trong các tình huống nhất định, người ta đã quan sát thấy rằng chuyển động vật lý của dữ liệu từ bộ nhớ có thể tiêu tốn năng lượng gấp 500 lần so với quá trình xử lý dữ liệu thực tế . Xu hướng này dự kiến ​​sẽ xấu đi khi quy mô chip. 

    Trí tuệ nhân tạo chuyên sâu về sức mạnh và trí nhớ

    Nút thắt cổ chai von Neumann đặt ra một vấn đề đặc biệt khó khăn đối với các ứng dụng trí tuệ nhân tạo vì tính chất thâm dụng bộ nhớ của chúng. Hoạt động của mạng nơ-ron phụ thuộc vào phép nhân ma trận vectơ lớn và sự di chuyển của một lượng lớn dữ liệu cho những thứ như trọng số, tất cả đều được lưu trữ trong bộ nhớ. 

    Ví dụ về mạng nơ-ron chạy trên đám mây.
    Ví dụ về mạng nơ-ron chạy trên đám mây. Hình ảnh được sử dụng lịch sự của  Salman Taherizadeh

    Những hạn chế về sức mạnh và thời gian do sự di chuyển của dữ liệu vào và ra khỏi bộ nhớ đã khiến các thiết bị máy tính nhỏ như điện thoại thông minh gần như không thể chạy mạng nơ-ron. Thay vào đó, dữ liệu phải được cung cấp thông qua các công cụ dựa trên đám mây, gây ra nhiều lo ngại về quyền riêng tư và độ trễ. 

    Một "đột phá" trong AI Chip: Xử lý NN trong Bộ nhớ

    Đối với nhiều người, câu trả lời cho vấn đề này là rời xa kiến ​​trúc von Neumann khi thiết kế chip AI. 
    Tuần này, Imec và GLOBALFOUNDRIES đã công bố một cuộc trình diễn phần cứng của một chip trí tuệ nhân tạo mới , thách thức quan điểm rằng xử lý và lưu trữ bộ nhớ phải là những chức năng hoàn toàn riêng biệt.
    Thay vào đó, kiến ​​trúc mới mà họ đang sử dụng được gọi là điện toán tương tự trong bộ nhớ (AiMC). Như tên cho thấy, các phép tính được thực hiện trong bộ nhớ mà không cần chuyển dữ liệu từ bộ nhớ sang CPU. Ngược lại với chip kỹ thuật số, tính toán này xảy ra trong miền tương tự.

    Chi imec và GF AI
    Chip AI imec và GF. Hình ảnh (đã sửa đổi) được sử dụng với sự cho phép của imec
     
    Thực hiện tính toán tương tự trong các ô SRAM, máy gia tốc này có thể xử lý cục bộ nhận dạng mẫu từ các cảm biến, có thể dựa vào học máy trong trung tâm dữ liệu. 

    Hiệu quả năng lượng vượt trội

    Con chip mới tuyên bố đã đạt được hiệu suất năng lượng đáng kinh ngạc lên tới 2.900 TOPS / W, được cho là “tốt hơn từ mười đến một trăm lần so với các máy gia tốc kỹ thuật số”. 
    Tiết kiệm nhiều năng lượng này sẽ làm cho việc chạy mạng nơ-ron trên các thiết bị cạnh khả thi hơn nhiều. Cùng với đó là giảm bớt những lo ngại về quyền riêng tư, bảo mật và độ trễ liên quan đến điện toán đám mây. 
    Con chip mới này hiện đang được phát triển tại dây chuyền sản xuất 300mm của GF ở Dresden, Đức và có vẻ sẽ tiếp cận thị trường trong tương lai gần.

    Không có nhận xét nào

    Post Top Ad

    ad728

    Post Bottom Ad

    ad728