Intel, ARM và NVIDIA đề xuất định dạng 8-bit FP mới để tăng tốc xử lý AI

15/09/2022

ARM, Intel và NVIDIA mới đây đã chung tay nộp lên Viện Đại học nghiên cứu tư thục Cornell bản báo cáo đề xuất mô tả thông tin kỹ thuật dấu chấm động 8-bit (FP8) với hai biến thể mới của nó là E5M2 và E4M3 để cung cấp một định dạng hoán đổi chung dành cho tác vụ huấn luyện và suy luận của trí tuệ nhân tạo AI.

Các yêu cầu về tính toán của AI thời nay ngày càng tăng theo cấp số nhân. Những cải tiến mới về phần cứng lẫn phần mềm là rất cấp thiết để đem lại lưu lượng tính toán đủ tốt nhằm nâng cấp AI. Một trong những điểm cần cải thiện là giảm yêu cầu về độ chuẩn số học dành cho khả năng học sâu để nâng tầm hiệu quả bộ nhớ và xử lý tính toán của AI. Các phương pháp giảm độ chuẩn khai thác các đặc tính chống nhiễu của hệ thống mạng nơ rôn sâu nhằm tăng cường hiệu quả tính toán.

Intel dự định sẽ hỗ trợ thông số kỹ thuật của định dạng này trên lộ trình phát triển sản phẩm nền tảng AI dành cho vi xử lý, nhân đồ họa và các bộ gia tốc xử lý AI khác, bao gồm bộ gia tốc AI học sâu Habana Gaudi.

FP8 giảm thiểu độ sai lệch so với những định dạng dấu chấm động IEEE 754 đang hiện hữu với sự cân bằng tốt giữa xử lý phần cứng và phần mềm để tận dụng trong những dự án đang triển khai, đẩy nhanh áp dụng và cải thiện năng suất của nhà phát triển.

Nguyên tắc của định dạng dấu chấm động theo đề xuất của ARM, Intel và NVIDIA hướng đến việc tận dụng các quy ước, khái niệm và thuật toán đã được xây dựng trên nền tảng chuẩn hóa của IEEE. Điều này giúp những phát minh liên quan đến AI về sau có tương lai xán lạn hơn trong khi vẫn đáp ứng các quy định hiện tại của ngành.

Nguồn: TechPowerUp dẫn từ Viện đại học Cornell.