CRM Software

Series Tất tần tật về AI Agents: Prompt Engineering, RAG và Finetuning (P2)

Các AI Agents là những chiếc lá. Mỗi chiếc lá sẽ có truyền tín hiệu tới Rễ cây nhưng theo những cách khác nhau, đó chính là: Prompt, RAG và Finetuning.
Được viết bởi
Nam Nguyen
Xuất bản trên
February 3, 2025

Để bạn không bị loạn chưởng với AI agents trước khi nói kỹ hơn chủ đề.  Bạn hãy tưởng tượng một cái cây đại thụ to lớn.

- Rễ cây chính là các LLM (Large language model) như GPT, Gemini (Google), Claude, Llama (Meta) hay DeepSeek, nơi thật sự có công tác Machine Learning thu thập, huấn luyện dữ liệu. Gọi là nổi bật thì chỉ khoảng 10 LLM lớn.

- Gốc cây được tách thành nhiều nhánh, có nhánh liên quan tới ngôn ngữ, nhánh khác liên quan với hình ảnh, video, lại có nhánh liên quan tới âm nhạc…như Dall-E2, Imagen, Claude, Gemini. Số lượng nhánh cây chắc cũng chỉ loanh quanh dưới 30 cái lớn.

- Các cành và lá cây chính là các ứng dụng AI tạo ra.  Số lượng hiện nay đã lên tới cả trăm ngàn cái và mỗi ngày lại có thêm nhiều cái mới. Các lá cây được quảng cáo nghe pro ghê gớm này kia nhưng cuối cùng cũng dùng chung loanh quanh mấy chục Rễ cây và Nhánh cây bên trên.

Các AI Agents là những chiếc lá. Mỗi chiếc lá sẽ có truyền tín hiệu tới Rễ cây nhưng theo những cách khác nhau, đó chính là: Prompt, RAG và Finetuning.

1. Prompt Engineering

Mỗi khi chúng ta đưa ra một yêu cầu cho ChatGPT hay Gemini, đó chính là một Prompt, nghệ thuật đặt Prompt nôm na được gọi là Prompt Engineering. Tuy nhiên, không phải ai cũng biết cách đặt Prompt cho hiệu quả để có kết quả như mong muốn. Vì vậy, có những AI Agents chỉ làm một việc là tinh chỉnh prompt mà vẫn kiếm được tiền. Ví dụ, thay vì prompt “Viết 1 bài viết về sự khác biệt của CRM B2B và B2C”, thì prompt được chỉnh lại thành:

- Hãy đóng vai Nam Nguyễn, tác giả của cuốn sách “Cưa đổ CRM”, hãy viết một bài viết…

- Hoặc: Hãy xem người đọc của bạn là những sinh viên mới ra trường, chưa từng biết gì về CRM, hãy viết một bài viết…

- Hoặc phức tạp hơn, xây dựng cả một ngữ cảnh có phân nhánh với nhiều điều kiện ràng buộc để có kết quả sát với ngữ cảnh yêu cầu, còn tiết kiệm được chi phí (token).

2. RAG

Prompt Engineering không thể mapping các prompt vào ngữ cảnh một cách thủ công (vì số lượng prompt quá đa dạng) nên chỉ xử lý được các vấn đề chung chung. Vì vậy, để xử lý các vấn đề cụ thể như người mua hàng cụ thể khiếu nại, hay cần truy vấn và chỉnh sửa thông tin của một đơn hàng/mặt hàng cụ thể… thì AI Agents cần truy xuất thêm thông tin từ một nguồn dữ liệu bên ngoài.

Và phương án này được gọi là RAG (Retrieval-Augumented Generation).

Dữ liệu bên ngoài có thể là các đoạn chat trước đó, hoặc là 1 cơ sở dữ liệu của ứng dụng cụ thể, hoặc dữ liệu dưới nhiều định dạng khác nhau.

Việc tổ chức RAG là một nghệ thuật trong việc tối ưu tốc độ, bảo mật và cả tiết kiệm chi phí token.

3. Finetuning

Finetuning là phương án dạy lại (điều chỉnh trọng số) AI Agents bằng tập dữ liệu chuẩn xác hoặc mới hơn so với dữ liệu mà LLM được dạy trước đó. Chỗ này điểm lại các phương pháp bằng 1 ví dụ cho dễ hiểu:

- Prompt thường: “Viết một bài thơ về CRM”

- Prompt xịn “Prompt Engineering”: Dùng bút pháp của Nam Nguyễn “Viết một bài thơ về CRM”

- Prompt dùng RAG: Dùng bút pháp của Nam Nguyễn tại dòng thứ 2, trang 129 trong cuốn sách Cưa đổ CRM để “Viết một bài thơ về CRM” - (Lúc này cần nạp thêm toàn bộ nội dung cuốn sách Cưa đổ CRM và xem như 1 cơ sở dữ liệu bên ngoài)

- Nếu hệ thống quăng ra một bài thơ quê xệ hoặc không còn hợp thời, thì phải áp dụng Finetuning - hướng dẫn cho AI Agents tham khảo thêm toàn bộ các bài viết về CRM của Nam Nguyễn trên Facebook trong năm 2024 cho nó học lại về khái niệm CRM.

Như vậy, RAG liên quan tới tính đúng sai (facts), còn Finetuning lại liên quan đến hình thức (form). Nếu Prompt không đủ thông tin và dữ liệu, thì RAG là giải pháp. Nhưng nếu kết quả trả về là “không sai” nhưng lại không liên quan hoặc không đáp ứng yêu cầu hoặc không đủ tinh tế (behavior issue) thì Finetuning là giải pháp.

Tóm lại, AI Agents dùng Prompt Engineer, hoặc RAG hoặc Finetune, hoặc có thể cả RAG lẫn Finetune (RAFT). Tuy nhiên, ở thời điểm hiện tại thì RAG phổ biến nhất.

Bản tin hàng tuần
Không có thư rác. Chỉ có các bản phát hành và mẹo mới nhất, các bài viết thú vị và các cuộc phỏng vấn độc quyền trong hộp thư đến của bạn mỗi tuần.
Đọc về chúng tôi Chính sách bảo mật.
Cảm ơn bạn! Đệ trình của bạn đã được nhận!
Rất tiếc! Có gì đó không ổn khi gửi biểu mẫu.