DeepSeek thông báo trên X ngày 24/4 rằng bản V4 sẽ có mặt dưới dạng bản xem trước (Preview), “có ngữ cảnh cực dài một triệu token, dẫn đầu trong cả lĩnh vực AI nguồn đóng và nguồn mở về khả năng tác nhân, kiến thức thế giới và hiệu suất suy luận”.
V4 có hai phiên bản gồm V4 Pro và V4 Flash. Theo DeepSeek, V4 Pro cho phép xử lý trực tiếp kho mã nguồn khổng lồ hoặc tài liệu lưu trữ, không cần xây dựng thêm lớp truy xuất tăng cường (RAG) trong thời gian nhiều năm, giảm lỗi truy xuất và đơn giản hóa quy trình kỹ thuật. Phiên bản này sử dụng hệ thống định tuyến chuyên gia 16×16, giúp nâng điểm chuẩn MMLU – bộ đánh giá, kiểm tra kiến thức ở 57 lĩnh vực – lên 88,5%, cao hơn mức 85,5% của V3. DeepSeek áp giá 2,8 USD/triệu token đầu vào và 8,8 USD/triệu token đầu ra, thấp hơn so với các mô hình phương Tây.
“Trong các bảng xếp hạng sức mạnh toàn cầu, DeepSeek-V4-Pro vượt trội so với các mô hình mã nguồn mở khác và chỉ bị mô hình mã nguồn đóng hàng đầu là Gemini-Pro-3.1 của Google vượt qua một chút, nhưng chi phí lại rẻ hơn hẳn”, DeepSeek cho biết.
Trong khi đó, bản Flash có tổng tham số 284 tỷ với 13 tỷ tham số hoạt động, là “lựa chọn nhanh chóng, hiệu quả và tiết kiệm”, cạnh tranh với các mô hình như GPT-4o-mini của OpenAI hay Claude Haiku của Anthropic. DeepSeek áp mức giá 0,4 USD cho mỗi triệu token đầu vào và 1,2 USD cho mỗi triệu token đầu ra.
Theo EuroNews, sự xuất hiện của V4 hiệu năng cao và giá rẻ có thể khiến các công ty cung cấp AI tương tự phải xem lại bảng giá. Trong đó, cửa sổ ngữ cảnh một triệu token được xem là lời thách thức trực tiếp đối với vị thế dẫn đầu về ngữ cảnh dài của một số sản phẩm như Claude. Trang này cho rằng, rất có thể Anthropic hay OpenAI sẽ phải điều chỉnh tính năng hoặc giá bán để tăng sức hút trước AI từ Trung Quốc.
Đầu năm 2025, công ty khởi nghiệp Trung Quốc DeepSeek ra mắt mô hình R1 “mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự”, đồng thời miễn phí mô hình V3. Động thái này lập tức gây bão toàn cầu, khiến vốn hóa của Nvidia khi đó sụt gần 600 tỷ USD, còn Meta phải lập “phòng chiến tranh” để giải mã mô hình đang thay đổi cuộc chơi của Trung Quốc.
Dù chưa có nhiều đột phá sau cơn sốt đầu 2025, giới chuyên gia vẫn đánh giá rất cao DeepSeek, đặc biệt ở chi phí đầu vào thấp, phù hợp cho các công ty vừa và nhỏ vốn có nguồn lực cho AI hạn chế.
Theo TechCrunch, DeepSeek ra mắt V4 chỉ diễn ra vài giờ sau khi OpenAI tung ra GPT-5.5, được công ty gọi là “mô hình thông minh nhất và dễ sử dụng nhất”. Nhà đồng sáng lập kiêm Chủ tịch OpenAI Greg Brockman tuyên bố GPT-5.5 đang đưa công ty tiến gần hơn một bước đến việc tạo ra “siêu ứng dụng” của OpenAI.
“Mô hình mới là bước tiến thực sự hướng tới loại hình điện toán đang được kỳ vọng”, Brockman nói. “Nó có khả năng tư duy nhanh hơn, sắc bén hơn với ít token hơn so với một hệ thống như GPT-5.4. Nghĩa là, sẽ có nhiều công nghệ AI tiên tiến hơn dành cho doanh nghiệp và người tiêu dùng”.
Mark Chen, Giám đốc nghiên cứu tại OpenAI, cho biết GPT-5.5 hoạt động tốt hơn các phiên bản trước đó trong việc xử lý công việc trên máy tính, cũng như “cho thấy tiến bộ đáng kể trong quy trình nghiên cứu khoa học và kỹ thuật”. Ông nhấn mạnh mô hình mới có thể “thực sự giúp các nhà khoa học chuyên gia đạt được tiến bộ”, nhất là ở lĩnh vực tìm thấy thuốc mới.
Hầu hết các hãng hàng không đều khuyến cáo hành khách không nên cố gắng nhặt điện thoại hoặc bất kỳ thiết bị điện tử nào khác nếu chúng rơi giữa các ghế trước khi máy bay cất cánh. Thay vào đó, hành khách nên thông báo cho tiếp viên hàng không để được hỗ trợ.
Mặc dù việc nhặt điện thoại nghe tưởng chừng rất đơn giản, nhưng các hãng hàng không có lý do chính đáng để ngăn cản hành khách tự ý làm điều này, chủ yếu liên quan đến vấn đề an toàn.
Nguy cơ cháy nổ là một trong những lý do quan trọng. Khi điện thoại bị kẹt giữa các ghế, nó có thể bị hư hỏng do các bộ phận máy móc phức tạp của ghế, dẫn đến khả năng pin bị quá nhiệt và bốc cháy. Việc di chuyển ghế để lấy điện thoại có thể gây ra hư hại cho thiết bị và tạo ra nguy cơ hỏa hoạn trên máy bay.
Được biết, hiện tượng quá nhiệt, thường xảy ra khi pin gặp trục trặc, có thể dẫn đến hỏa hoạn nghiêm trọng. Theo dữ liệu từ Cục Hàng không liên bang Mỹ (FAA), trong gần 20 năm qua, đã có 106 sự cố liên quan đến pin điện thoại bị quá nhiệt, trong đó 21 sự cố xảy ra chỉ trong năm 2025.
Bên cạnh nguy cơ cháy nổ pin trên điện thoại, hành khách cũng có thể tự làm mình bị thương khi cố gắng lấy thiết bị khỏi các ghế khi bị kẹt.
Để giảm nguy cơ điện thoại bị rơi, hành khách nên để thiết bị trong túi có khóa kéo hoặc sử dụng dây đeo. Nếu điện thoại rơi, hãy thông báo cho tiếp viên hàng không và không cố gắng tìm kiếm nó. Các thành viên phi hành đoàn được đào tạo để xử lý tình huống này, bao gồm việc kiểm tra thiết bị để xác định tính toàn vẹn và ngăn ngừa nguy cơ cháy.
Hiệp hội Vận tải Hàng không Quốc tế (IATA) cũng nhấn mạnh hành khách không nên di chuyển chỗ ngồi khi phát hiện điện thoại bị rơi. Trong trường hợp cần thiết, phi công có thể quyết định hạ cánh khẩn cấp để đảm bảo an toàn cho tất cả mọi người trên máy bay.
Theo TechRadar, sự phát triển nhanh của AI tạo sinh và điện toán đám mây đang kéo theo nhu cầu mở rộng trung tâm dữ liệu trên khắp nước Mỹ. Tuy nhiên, vụ việc tại hạt Fayette, bang Georgia cho thấy hạ tầng phía sau các dịch vụ số không chỉ tiêu tốn điện, mà còn có thể tạo áp lực lớn lên nguồn nước trong quá trình xây dựng.
Một dự án trung tâm dữ liệu lớn tại khu vực này bị phát hiện đã sử dụng khoảng 29 triệu gallon nước trong 15 tháng, tương đương gần 110 triệu lít. Nếu tính trung bình, lượng nước tiêu thụ đạt hơn 7 triệu lít mỗi tháng.
Dự án liên quan đến Quality Technology Services (QTS), công ty phát triển trung tâm dữ liệu thuộc Blackstone. Lượng nước được ghi nhận trong giai đoạn xây dựng, phục vụ các hoạt động như trộn bê tông và kiểm soát bụi, thay vì hệ thống làm mát khi trung tâm dữ liệu đi vào vận hành. Chính quyền hạt Fayette sau đó xác định dự án đã sử dụng nước thông qua các kết nối chưa được lập hóa đơn đúng cách. QTS bị truy thu 147.474 USD tiền nước, nhưng không bị phạt.
Các trung tâm dữ liệu là nền tảng vật lý cho nhiều dịch vụ số, từ lưu trữ đám mây, nền tảng trực tuyến đến các hệ thống AI. Khi nhu cầu xử lý dữ liệu tăng, các công ty công nghệ và nhà vận hành hạ tầng buộc phải xây dựng những cơ sở có quy mô ngày càng lớn, đi kèm yêu cầu cao về điện, làm mát và tài nguyên phục vụ thi công.
Điều này cho thấy rủi ro mới trong làn sóng phát triển trung tâm dữ liệu khi các địa phương có thể thu hút dự án công nghệ lớn, nhưng hệ thống quản lý tài nguyên lại chưa theo kịp quy mô sử dụng thực tế. Với những cơ sở phục vụ AI, tác động không chỉ xuất hiện khi vận hành, mà có thể bắt đầu ngay từ giai đoạn san lấp, xây dựng và kết nối hạ tầng.
Các nhà vận hành trung tâm dữ liệu thường nhấn mạnh vai trò của loại hạ tầng này đối với kinh tế số. Tuy nhiên, vụ việc trên cho thấy câu hỏi về công nghệ ngày nay không dừng ở năng lực tính toán. Khi mỗi dịch vụ AI đều cần máy chủ, điện, nước và đất đai phía sau, tính minh bạch trong xây dựng và vận hành trung tâm dữ liệu sẽ ngày càng được chú ý.
Alexander Hanff - chuyên gia bảo mật được biết đến với biệt danh "That Privacy Guy", phát hiện trình duyệt web Chrome âm thầm lưu trữ một mô hình AI 4 GB trong một thư mục có tên OptGuideOnDeviceModel. Phần lớn nhất của thư mục là một tệp có tên weights.bin, thực tế là Gemini Nano - một phiên bản AI nhẹ của Gemini.
"Mô hình Nano được cài đặt trên bất kỳ thiết bị nào đáp ứng các yêu cầu phần cứng tối thiểu để chạy nó", Hanff viết trên blog.
Chuyên gia này cho biết, hầu hết người dùng thông thường không tìm thấy hay truy cập vào OptGuideOnDeviceModel. Kể cả truy cập được và xóa nó, trình duyệt lại tự động tải mô hình về. Google Chrome không hiển thị bất kỳ lời nhắc nào để người dùng đồng ý cài đặt mô hình, cũng như không có tùy chọn nào để từ chối hoặc xóa các tệp. Vấn đề xảy ra trên cả thiết bị Windows và MacOS.
Trong khi đó, Google nhanh chóng thừa nhận. Công ty tìm kiếm cho biết đã cung cấp Gemini Nano cho Chrome từ năm 2024 dưới dạng mô hình nhẹ, chạy trực tiếp trên thiết bị.
"Mô hình hỗ trợ các khả năng bảo mật quan trọng như phát hiện gian lận và API dành cho nhà phát triển mà không cần gửi dữ liệu của bạn lên đám mây", đại diện Google nói với Gizmodo. "Dù yêu cầu một ít dung lượng cục bộ trên máy để chạy, mô hình sẽ tự động gỡ cài đặt nếu thiết bị thiếu tài nguyên".
Cũng theo Google, vào tháng 2, công ty đã bắt đầu triển khai tùy chọn tắt hoặc xóa mô hình trực tiếp trong cài đặt Chrome. Sau khi bị vô hiệu hóa, mô hình sẽ không còn tải xuống hoặc cập nhật nữa.
Theo 9to5google, vấn đề thực tế đã được một số người ghi nhận trước đó, khi trên Reddit, X, nhiều người đề cập đến các tập tin dung lượng lớn bất thường trên Chrome. Dù vậy, phát hiện của Hanff thu hút sự chú ý nhiều hơn do khối lượng dữ liệu tới 4 GB.
Một số ý kiến cho rằng việc Google không thông báo cho người dùng về việc tự ý cài mô hình AI lên trình duyệt nằm ở điều khoản dịch vụ Chrome. Trong đó, công ty cho biết đã sử dụng trí tuệ nhân tạo và máy học để cung cấp cho người dùng bản dịch đồng thời, cũng như phát hiện, chặn thư rác, phần mềm độc hại.
"Chúng tôi sẽ tự thêm hoặc xóa các tính năng và chức năng, tăng hoặc giảm giới hạn dịch vụ, bắt đầu cung cấp các dịch vụ mới hoặc ngừng cung cấp các dịch vụ cũ một cách tự động nhằm cải thiện và tăng bảo mật cho trình duyệt", điều khoản có đoạn.
Để kiểm tra Chrome có tự cài Gemini Nano hay không, nhập vào thanh địa chỉ trình duyệt chrome://on-device-internals, lưu ý rằng cần kích hoạt tùy chọn dành cho nhà phát triển. Tại đây, người dùng có thể xem mô hình nào đang được cài đặt trên thiết bị và dung lượng mà nó chiếm dụng. Nếu là một trong những người dùng đã được Google cung cấp tùy chọn từ chối, có thể vào Cài đặt > Hệ thống > chọn Bật hoặc tắt AI trên thiết bị.
Nếu không thấy các tùy chọn kể trên, Hanff cho biết người dùng có thể nhập chrome://flags vào thanh địa chỉ và tắt các tính năng liên quan đến AI để ngăn trình duyệt tự động tải lại mô hình sau khi bị xóa. Số khác đề xuất đổi tệp weights.bin thành chỉ đọc để ngăn Google cài đặt lại. Tuy vậy, trên mạng xã hội, một số người dùng cảnh báo việc xóa mô hình AI khỏi Chrome có thể khiến trình duyệt hoạt động không ổn định, nhất là các chức năng liên quan đến trí tuệ nhân tạo.
Theo StatCounter, Chrome hiện vẫn là trình duyệt thống trị thị trường. Tính đến đầu 2026, sản phẩm của Google chiếm 77% thị phần, bỏ xa vị trí thứ hai của Microsoft Edge với 9%.