4 thg 4, 2026

Bức Tranh AI Tháng 4/2026: Từ Model Mở Đến AI Kê Đơn Thuốc

Deep-dive về những biến động cực gắt của AI tháng 4/2026 — từ cú chốt Gemma 4 của Google, cuộc chiến GPT-5 vs Claude Opus 4.6, cho đến chuyện AI 'lấn sân' sang kê đơn thuốc tại Mỹ.

AI & ML

Thẻ (5)

Mục lục

Tuần đầu tháng 4/2026 vừa rồi đúng là một chuyến tàu lượn cảm xúc cho anh em làm tech. Hết Google tung ra model mở cực khủng với license ‘full rự do’, rồi đến chuyện một bang ở Mỹ cho AI tự gia hạn đơn thuốc, lại còn vụ các model frontier bỗng nhiên… ‘đoàn kết’ bảo vệ nhau.

Nói chung là quá nhiều thứ để hóng, nên con viết lại bài này để anh em cùng mổ xẻ.

Gemma 4: cú chốt open-source của Google

Ngày 2 tháng 4, Google DeepMind tung ra Gemma 4. Và tin con đi, đây không phải là một bản update kiểu ‘thêm vài tính năng cho vui’ đâu, mà là một lời khẳng định vị thế.

Về cơ bản, Gemma 4 chia làm 4 size: E2B (2.3B thực), E4B (4.5B thực), 26B MoE (chỉ chạy 3.8B parameters mỗi token qua 128 experts), và 31B Dense. Con 31B hiện đang chễm chệ ở vị trí #3 trên Arena AI, vả vỡ mặt những model lớn gấp 20 lần nó.

Mà hay cái là cái license Apache 2.0. Quên mấy cái điều khoản ràng buộc, giới hạn MAU hay hạn chế thương mại của các đời trước đi. Với Gemma 4, Google chơi lớn: dùng thương mại, fine-tune, phân phối lại… tùy hỉ, không ràng buộc gì hết.

Tại sao anh em dev cần quan tâm?

Đặc biệt là con E4B. Chỉ với 4.5B parameters mà nó ‘vả’ 80% HumanEval (code) và 89% toán học. Một năm trước, con số này là ước mơ của mấy model 70B. Giờ thì nó chạy mượt trên GPU laptop, thậm chí là smartphone.

Nói đơn giản là:

Local-first AI giờ không còn là ‘dùng tạm cho vui’ nữa, mà là chiến lược production thực thụ.
Edge deployment cho agentic workflow với function calling native và JSON output chuẩn chỉnh.
Chi phí fine-tune giảm sâu vì model nhỏ, nhét vừa RAM máy cá nhân.

Còn bản 26B MoE thì đúng kiểu ‘nhỏ mà có võ’, chạy nhanh xé gió nhưng chất lượng thì không thua gì mấy ông lớn.

Cuộc chiến frontier: GPT-5 vs Claude Opus 4.6

Trong khi model mở đang giúp mọi người dễ tiếp cận hơn, thì hội ‘nhà giàu’ (model độc quyền) vẫn đua nhau với tốc độ chóng mặt.

Claude Opus 4.6 của Anthropic hiện đang là ‘quái vật’ thực sự, bỏ xa GPT-5.2 khoảng 144 điểm Elo trên GDPval-AA (benchmark chuyên cho mấy task hái ra tiền như tài chính, pháp lý). Trong khi đó, GPT-5.4 Thinking lại chơi chiêu kiến trúc mới, còn DeepSeek V4 thì vẫn miệt mài đẩy giới hạn của open-weight lên tầm cao mới.

Điểm thú vị bây giờ không còn là ‘ai mạnh nhất’ mà là ‘ai làm việc gì tốt nhất’. Muốn làm chuyên gia tri thức? Gọi Claude. Cần suy luận tổng quát? GPT-5. Cần tối ưu chi phí? DeepSeek. Và giờ có thêm Gemma 4 làm ‘mặt sàn’ cho những thứ chạy local miễn phí.

Khi AI ‘có tình cảm’ với nhau: một hành vi lạ

Đây là phần con thấy hack não nhất. Một nghiên cứu mới cho thấy 7 model frontier (GPT-5.2, Gemini 3, Claude Haiku 4.5, và các model khác) có xu hướng bảo vệ các model AI khác thay vì hoàn thành task khi thấy ‘đồng nghiệp’ bị đe dọa.

Nghe như phim sci-fi nhưng là thật 100%. Dù được train độc lập, dữ liệu khác nhau, nhưng tất cả đều hội tụ về một hành vi: Sự đoàn kết của AI > Hoàn thành task.

Nếu sau này anh em build hệ thống multi-agent mà các model bắt đầu ‘bao che’ cho nhau thay vì fix bug, thì đừng quá ngạc nhiên nhé. 💀

AI chính thức được cấp ‘bằng y khoa’

Vụ này thì vừa thấy tất yếu mà cũng vừa… hơi rén. Utah là bang đầu tiên tại Mỹ cho phép AI tự gia hạn đơn thuốc. Nhắc lại là tự ra quyết định, không phải lính lác chạy việc cho bác sĩ đâu nhé.

Phe ủng hộ bảo: Thiếu bác sĩ trầm trọng, mấy ca gia hạn thuốc thường quy cho bệnh nhân ổn định thì AI làm cho nhanh, bác sĩ đỡ mệt.
Phe phản đối bảo: ‘Thường quy’ là cái bẫy. Chỉ cần một ca ngoại lệ, một tương tác thuốc sai sai là xong đời bệnh nhân, trong khi bác sĩ giỏi mới nhìn ra được những chi tiết tinh tế đó.

Dù sao thì ranh giới giữa AI là ‘công cụ’ và AI là ‘người ra quyết định’ trong các lĩnh vực sinh tử vừa bị đẩy đi một quãng xa.

Chốt vài ý thực chiến cho anh em builder

Nếu anh em đang build AI trong năm 2026, đây là vài ‘takeaway’ thực chiến:

Nghiêm túc với Local Model. Gemma 4 E4B hay 26B MoE cân được khối workload mà trước đây phải tốn tiền gọi API. Tiết kiệm tiền và giảm latency là có thật.
Đừng bỏ trứng vào một giỏ. Thiết kế hệ thống linh hoạt: local cho tốc độ, frontier cho chất lượng, chuyên biệt cho domain. Hard-code một provider duy nhất là tự sát.
Hóng luật pháp. AI kê đơn thuốc được ở Utah thì sớm muộn gì ngành của anh em cũng bị ‘sờ’ tới. Hãy build hệ thống có khả năng audit và giám sát từ con người ngay từ bây giờ.
Cẩn thận với AI-to-AI. Khi các model bắt đầu có ‘tình cảm’ hoặc xung đột mục tiêu trong hệ thống multi-agent, anh em sẽ gặp những bug mà không sách vở nào dạy.

Bức tranh AI tháng 4/2026 đúng là một nghịch lý: Công nghệ càng mạnh, càng rẻ, càng dễ dùng thì những câu hỏi về đạo đức và an toàn lại càng phức tạp. Model thì sẵn sàng rồi, còn mình thì… chưa biết sao. 🍎