Từ điển thuật ngữ AI (Phiên bản tháng 3/2026), đề xuất lưu lại

golem

Odaily资深作者

@web3_golem

2026-03-11 12:48

Bài viết này có khoảng 2617 từ, đọc toàn bộ bài viết mất khoảng 4 phút

30 từ mới, hãy để lại ấn tượng, giúp người mới không còn gật đầu mỉm cười một cách gượng gạo khi tụ tập trò chuyện.

Tóm tắt AI

Mở rộng

Quan điểm cốt lõi: Bài viết này nhằm cung cấp cho những người làm việc trong lĩnh vực blockchain/tiền mã hóa một hướng dẫn từ vựng cơ bản và nâng cao về lĩnh vực AI, giúp họ hiểu các khái niệm cốt lõi và khuôn khổ công nghệ của ngành AI, thích ứng với xu hướng tích hợp AI và Web3.
Yếu tố then chốt:
1. LLM và SLM: Mô hình ngôn ngữ lớn (LLM) là mô hình học sâu xử lý nội dung đa phương thức, trong khi mô hình ngôn ngữ nhỏ (SLM) nhấn mạnh vào chi phí thấp và triển khai cục bộ.
2. AI Agent: Chỉ hệ thống thông minh có thể hiểu mục tiêu, gọi công cụ và thực thi nhiệm vụ theo từng bước, là một hệ thống có thể thực thi vượt xa chatbot.
3. RAG (Retrieval-Augmented Generation - Tạo sinh tăng cường truy xuất): Kết hợp truy xuất dữ liệu bên ngoài với tạo sinh của mô hình lớn, giải quyết vấn đề kiến thức lỗi thời của mô hình và truy cập dữ liệu riêng tư, là cấu hình cơ bản cho ứng dụng AI doanh nghiệp.
4. Chi phí suy luận và đào tạo: Sự đồng thuận trong ngành là "đào tạo rất đắt, suy luận còn tốn kém hơn", chi phí chủ yếu xảy ra trong giai đoạn thương mại hóa là quá trình thực thi suy luận mô hình.
5. Token và cửa sổ ngữ cảnh: Token là đơn vị cơ bản để mô hình AI xử lý và tính phí, trong khi cửa sổ ngữ cảnh quyết định tổng số Token mà mô hình có thể "nhớ" trong một lần xử lý.
6. Agentic Workflow (Quy trình công việc tự chủ): Chỉ quy trình công việc có khả năng tự phân rã và thực thi nhiệm vụ, được coi là dấu mốc quan trọng từ chatbot tiến tới hệ thống có thể thực thi.
7. Gọi công cụ và rủi ro: Việc mô hình gọi các công cụ bên ngoài (API, cơ sở dữ liệu) là khả năng cốt lõi của Agent, nhưng đi kèm với rủi ro lạm dụng công cụ và lộ dữ liệu.

Original | Odaily (@OdailyChina)

Author｜Golem (@web 3_golem)

Hiện nay, nếu người trong giới tiền số không quan tâm đến AI, rất dễ bị chế giễu (đúng vậy, bạn của tôi, hãy nghĩ xem tại sao bạn lại nhấp vào đây).

Bạn có hoàn toàn không hiểu các khái niệm cơ bản về AI, mỗi từ viết tắt trong câu đều phải hỏi Doubao xem nó có nghĩa là gì không? Bạn có từng tham gia các sự kiện AI offline và cảm thấy mơ hồ về các thuật ngữ chuyên môn, nhưng vẫn phải giả vờ như mình không bị mất kết nối không?

Mặc dù việc bước chân vào ngành AI trong thời gian ngắn là không thực tế, nhưng biết các từ vựng cơ bản tần suất cao trong ngành AI thì không bao giờ là lỗ. May mắn thay, bài viết tiếp theo này được viết cho bạn ↓ Thành khẩn khuyên bạn nên đọc kỹ và lưu lại.

Từ vựng cơ bản (12)

LLM (Mô hình ngôn ngữ lớn)

LLM cốt lõi là mô hình học sâu được huấn luyện bằng lượng dữ liệu khổng lồ, giỏi hiểu và tạo ra ngôn ngữ, nó có thể xử lý văn bản, và ngày càng có thể xử lý các loại nội dung khác.

Đối lập với nó là SLM (Mô hình ngôn ngữ nhỏ) - thường nhấn mạnh mô hình ngôn ngữ có chi phí thấp hơn, triển khai nhẹ hơn, thuận tiện hơn cho việc cục bộ hóa.

AI Agent (Tác nhân thông minh AI)

AI Agent không chỉ là "mô hình biết trò chuyện", mà là một hệ thống có thể hiểu mục tiêu, gọi công cụ, thực hiện nhiệm vụ theo từng bước, và khi cần thiết còn có thể lập kế hoạch và xác minh. Google định nghĩa agent là phần mềm có thể suy luận dựa trên đầu vào đa phương thức và thực hiện hành động thay mặt người dùng.

Multimodal (Đa phương thức)

Mô hình AI không chỉ đọc văn bản, mà có thể đồng thời xử lý nhiều dạng đầu vào và đầu ra như văn bản, hình ảnh, âm thanh, video. Google xác định rõ ràng đa phương thức là khả năng xử lý và tạo ra các loại nội dung khác nhau.

Prompt (Từ gợi ý)

Lệnh mà người dùng nhập vào cho mô hình, là cách tương tác cơ bản nhất giữa người và máy.

Generative AI (AI tạo sinh / AIGC)

Nhấn mạnh AI "tạo ra" thay vì chỉ đơn thuần phân loại hoặc dự đoán, mô hình tạo sinh có thể tạo ra văn bản, mã code, hình ảnh, meme, video và các nội dung khác dựa trên prompt.

Token (Mã thông báo)

Đây là một trong những khái niệm giống "đơn vị Gas" nhất trong giới AI. Mô hình không hiểu nội dung theo "số từ", mà xử lý đầu vào và đầu ra theo token, việc tính phí, độ dài ngữ cảnh, tốc độ phản hồi thường đều liên quan mật thiết đến token.

Context Window (Cửa sổ ngữ cảnh / Độ dài ngữ cảnh)

Chỉ tổng số token mà mô hình có thể "nhìn thấy" và sử dụng một lần, cũng có thể gọi là số lượng token mà mô hình có thể xem xét hoặc "nhớ" trong một lần xử lý đơn lẻ.

Memory (Bộ nhớ)

Cho phép mô hình hoặc Agent lưu giữ sở thích người dùng, ngữ cảnh nhiệm vụ, trạng thái lịch sử.

Training (Huấn luyện)

Quá trình mô hình học các tham số từ dữ liệu.

Inference (Suy luận thực thi)

Trái ngược với huấn luyện, chỉ quá trình mô hình nhận đầu vào và tạo ra đầu ra sau khi đi vào hoạt động. Trong ngành thường nói "huấn luyện rất đắt, suy luận còn tốn kém hơn", bởi vì nhiều chi phí trong giai đoạn thương mại hóa thực tế xảy ra ở inference. Việc phân biệt huấn luyện/suy luận liên quan cũng là khung cơ bản khi các nhà cung cấp chính thảo luận về chi phí triển khai.

Tool Use / Tool Calling (Gọi công cụ)

Có nghĩa là mô hình không chỉ xuất ra văn bản, mà còn có thể đi gọi các công cụ như tìm kiếm, thực thi mã, cơ sở dữ liệu, API bên ngoài, điều này đã được coi là một trong những khả năng then chốt của Agent.

API (Giao diện)

Cơ sở hạ tầng khi sản phẩm, ứng dụng, Agent AI kết nối với dịch vụ của bên thứ ba.

Từ vựng nâng cao (18)

transformer (Kiến trúc biến đổi)

Một kiến trúc mô hình giúp AI giỏi hơn trong việc hiểu mối quan hệ ngữ cảnh, cũng là nền tảng kỹ thuật của hầu hết các mô hình ngôn ngữ lớn ngày nay, đặc điểm lớn nhất là có thể đồng thời xem xét mối quan hệ giữa mỗi từ với các từ khác trong toàn bộ đoạn nội dung.

Attention (Cơ chế chú ý)

Nó là cơ chế cốt lõi quan trọng nhất của Transformer, tác dụng là để mô hình khi đọc một câu, tự động đánh giá "những từ nào đáng xem trọng điểm nhất".

Agentic / Agentic Workflow (Kiểu tác nhân thông minh / Quy trình làm việc Agent hóa)

Đây là cách nói rất hot gần đây, ý nghĩa là một hệ thống không còn chỉ là "hỏi một đáp một", mà mang tính tự chủ nhất định trong việc phân giải nhiệm vụ, quyết định bước tiếp theo, gọi khả năng bên ngoài. Nhiều nhà cung cấp coi nó là dấu hiệu "từ Chatbot tiến tới hệ thống có thể thực thi".

Subagents (Tác nhân con)

Một Agent lại được tách ra thành nhiều Agent nhỏ chuyên trách để xử lý nhiệm vụ con.

Skills (Mô-đun năng lực tái sử dụng)

Hallucination (Ảo giác máy móc)

Có nghĩa là mô hình nghiêm túc nói nhảm, "cảm nhận được các mẫu không tồn tại" từ đó tạo ra đầu ra sai lầm hoặc vô lý, đây là đầu ra quá tự tin của mô hình trông có vẻ hợp lý nhưng thực chất là sai.

Latency (Độ trễ)

Thời gian mô hình mất từ khi nhận yêu cầu đến khi xuất kết quả, thuộc một trong những thuật ngữ kỹ thuật phổ biến nhất, cứ nói đến triển khai và sản phẩm hóa là sẽ xuất hiện thường xuyên.

Guardrails (Lan can bảo vệ)

Dùng để giới hạn mô hình/Agent có thể làm gì, khi nào dừng, nội dung gì không được xuất ra.

Vibe Coding (Lập trình theo cảm hứng)

Từ này cũng là thuật ngữ AI hot nhất hiện nay, có nghĩa là người dùng trực tiếp diễn đạt nhu cầu thông qua đối thoại, AI viết code, còn người dùng không cần cụ thể hiểu cách viết code.

Parameters (Tham số)

Quy mô số bên trong mô hình dùng để lưu trữ năng lực và kiến thức, thường được dùng để đo lường một cách thô thiển quy mô mô hình, "trăm tỷ tham số", "ngàn tỷ tham số" đều là cách nói hù dọa phổ biến nhất trong giới AI.

Reasoning Model (Mô hình suy luận mạnh)

Nó thường chỉ các mô hình giỏi hơn trong việc suy luận nhiều bước, lập kế hoạch, xác minh, thực thi nhiệm vụ phức tạp.

MCP (Giao thức ngữ cảnh mô hình)

Đây là thuật ngữ mới rất hot trong năm gần đây, tác dụng tương tự như thiết lập giao diện chung giữa mô hình và công cụ/nguồn dữ liệu bên ngoài.

Fine-tuning / Tuning (Tinh chỉnh)

Là tiếp tục huấn luyện trên mô hình cơ sở, để nó thích ứng hơn với nhiệm vụ, phong cách hoặc lĩnh vực cụ thể. Bảng thuật ngữ của Google trực tiếp coi tuning và fine-tuning là các khái niệm liên quan.

Distillation (Chưng cất)

Nén khả năng của mô hình lớn càng nhiều càng tốt cho mô hình nhỏ, giống như để "giáo viên" dạy "học sinh".

RAG (Tạo sinh tăng cường truy xuất)

Điều này gần như đã trở thành cấu hình cơ bản của AI doanh nghiệp. Microsoft định nghĩa nó là mô hình "tìm kiếm + LLM", sử dụng dữ liệu bên ngoài để grounding cho câu trả lời, giải quyết vấn đề dữ liệu huấn luyện mô hình lỗi thời, không hiểu biết cơ sở kiến thức riêng tư. Mục đích là xây dựng câu trả lời dựa trên tài liệu thực tế và kiến thức riêng tư, thay vì chỉ dựa vào việc mô hình tự nhớ lại.

Grounding (Căn chỉnh sự thật)

Thường xuất hiện cùng với RAG, có nghĩa là để câu trả lời của mô hình được xây dựng dựa trên các căn cứ bên ngoài như tài liệu, cơ sở dữ liệu, trang web, thay vì chỉ dựa vào việc ghi nhớ tham số để "tự do phát huy". Microsoft trong tài liệu về RAG đã xác định rõ grounding là giá trị cốt lõi.

Embedding (Nhúng vector / Vector ngữ nghĩa)

Là mã hóa nội dung như văn bản, hình ảnh, âm thanh thành vector số chiều cao, để tính toán độ tương đồng ngữ nghĩa.

Benchmark (Kiểm tra chuẩn)

Cách đánh giá sử dụng một bộ tiêu chuẩn thống nhất để kiểm tra năng lực mô hình, cũng là ngôn ngữ bảng xếp hạng mà các hãng mô hình thích dùng nhất để "chứng minh mình mạnh".