🤖 Applied AI & LLM Systems
Tổng quan
Module này đào sâu vào Architecture và Thuật toán bên trong các hệ thống LLM (Large Language Models) được ứng dụng trong Production. Thay vì chỉ sử dụng API như một black-box, chúng ta đi vào nội tại mô hình (Attention Mechanism, KV Cache, Tokenization) và kiến trúc hệ thống (Vector Indexing, Serving Memory Management).
Mục tiêu là cung cấp cái nhìn Engineering thuần túy (Compute & Memory bottlenecks), giúp Software/Data Engineer thiết kế hệ thống tối ưu hiệu năng và chi phí.