Xem nhanh
Với lần ra mắt này, Google đưa trí tuệ thế hệ mới của Gemini 3 đến gần hơn với người dùng trên các sản phẩm của Google.
Những ý chính:
- Google vừa chính thức mở rộng hệ sinh thái trí tuệ nhân tạo với dòng Gemini 3 Flash, một mô hình đột phá kết hợp giữa năng lực lập luận mạnh mẽ cấp độ Pro và tốc độ xử lý vượt trội với chi phí tối ưu.
- Điểm mạnh cốt lõi của Flash nằm ở tốc độ nhanh gấp 3 lần so với phiên bản 2.5 Pro và khả năng xử lý đa phương thức linh hoạt, từ phân tích video theo thời gian thực đến xây dựng ứng dụng phức tạp thông qua giọng nói.
- Gemini 3 Flash được kỳ vọng sẽ thúc đẩy làn sóng sáng tạo mới, cho phép hiện thực hóa các ý tưởng từ lập trình “vibe coding” đến quản trị kinh doanh một cách hiệu quả và tiết kiệm nhất.
Hôm nay, Google mở rộng mô hình Gemini 3 với việc ra mắt Gemini 3 Flash – phiên bản mang đến trí tuệ tiên phong, tối ưu tốc độ xử lý với chi phí thấp hơn đáng kể.

Tháng trước, Google đã khởi động Gemini 3 với Gemini 3 Pro cùng chế độ Gemini 3 Deep Think, và nhận được những phản hồi rất tích cực. Kể từ ngày ra mắt, Google đã xử lý hơn 1 nghìn tỷ token mỗi ngày trên API của mình. Google đã thấy bạn sử dụng Gemini 3 để lập trình theo ý tưởng và cảm hứng (vibe coding) nhằm tìm hiểu các chủ đề phức tạp, xây dựng và thiết kế các trò chơi tương tác, cũng như hiểu được nhiều loại nội dung đa phương thức.
Với Gemini 3, Google đã thiết lập chuẩn mực mới cho các tác vụ đòi hỏi suy luận phức tạp, khả năng hiểu đa phương thức và thị giác, cũng như khả năng lập trình tự động theo từng ngữ cảnh. Gemini 3 Flash kế thừa nền tảng ưu việt đó – kết hợp năng lực lập luận mạnh mẽ cấp độ Pro của Gemini 3 với tốc độ phản hồi nhanh, hiệu quả và chi phí tối ưu của dòng Flash. Nhờ vậy, mô hình không chỉ đáp ứng hiệu quả các nhu cầu sử dụng hàng ngày, mà còn đặc biệt phù hợp cho các quy trình làm việc dựa trên tác nhân (agentic workflows).
Gemini 3 Flash đang được triển khai đến hàng triệu người dùng trên toàn cầu từ hôm nay:
- Dành cho nhà phát triển: thông qua Gemini API trong Google AI Studio, Gemini CLI và nền tảng phát triển tự động hóa (agentic) mới – Google Antigravity
- Dành cho người dùng: thông qua ứng dụng Gemini và AI Mode trong Google Tìm kiếm
- Dành cho các doanh nghiệp sử dụng Vertex AI và Gemini Enterprise
Gemini 3 Flash: Trí tuệ tiên phong trên quy mô lớn
Gemini 3 Flash chứng minh rằng việc đạt được tốc độ cao và quy mô lớn không làm suy giảm khả năng thông minh của mô hình. Cụ thể, phiên bản này đạt hiệu suất đột phá trên các bài kiểm tra lập luận và kiến thức chuyên sâu cấp độ Tiến sĩ, như GPQA Diamond (90.4%) và Humanity’s Last Exam (33.7% khi không sử dụng công cụ), cho kết quả tương đương với các mô hình mạnh mẽ và lớn nhất trên thị trường. Đồng thời, Gemini 3 Flash cũng vượt trội hơn đáng kể so với Gemini 2.5 Pro trên nhiều thang đo đánh giá, với 81.2% trên MMMU Pro – tương đương với Gemini 3 Pro.

Bên cạnh khả năng lập luận tiên tiến và đa phương thức, Gemini 3 Flash được thiết kế để đạt hiệu quả cao, mở rộng giới hạn tối ưu giữa chất lượng, tốc độ và chi phí. Khi xử lý ở mức độ tư duy cao nhất, Gemini 3 Flash có thể linh hoạt điều chỉnh mức độ “suy nghĩ” phù hợp. Mô hình có thể suy nghĩ lâu hơn đối với các trường hợp phức tạp, đồng thời sử dụng trung bình ít hơn 30% token so với 2.5 Pro (đo trên lưu lượng sử dụng thực tế), để hoàn thành các tác vụ hằng ngày chính xác và hiệu quả.

Điểm mạnh của Gemini 3 Flash nằm ở tốc độ xử lý thực tế, tiếp nối mô hình Flash vốn đã được các nhà phát triển và người dùng yêu thích. Gemini 3 Flash vượt trội hơn 2.5 Pro, cho kết quả nhanh hơn gấp 3 lần (dựa trên kết quả đánh giá của Artificial Analysis), với mức chi phí cực kỳ tối ưu. Gemini 3 Flash có mức giá 0,50 USD/1 triệu token đầu vào và 3 USD/1 triệu token đầu ra (token đầu vào âm thanh vẫn giữ ở mức 1 USD/1 triệu token).
Dành cho nhà phát triển: Trí tuệ bắt nhịp mọi tốc độ
Gemini 3 Flash được thiết kế chuyên biệt để hỗ trợ quá trình phát triển lặp đi lặp lại. Mô hình này mang lại hiệu suất lập trình mạnh mẽ cấp độ Pro của Gemini 3 với tốc độ phản hồi cực nhanh. Trên SWE-bench Verified, một thang đo dùng để đánh giá năng lực của các tác nhân lập trình (coding agent), Gemini 3 Flash đạt điểm số 78% – vượt trội hơn cả phiên bản 2.5 và Gemini 3 Pro. Mô hình đạt được sự cân bằng lý tưởng giữa các yếu tố: lập trình theo tác nhân (agentic coding), triển khai trong các hệ thống vận hành thực tế và xây dựng các ứng dụng tương tác yêu cầu phản hồi nhanh.
Khả năng mạnh mẽ của Gemini 3 Flash trong việc suy luận, sử dụng công cụ và xử lý đa phương thức là lựa chọn lý tưởng cho các nhà phát triển muốn thực hiện những tác vụ phức tạp như phân tích video, trích xuất dữ liệu và hỏi đáp bằng hình ảnh. Điều này đồng nghĩa với việc mô hình có thể hỗ trợ các ứng dụng thông minh hơn như trợ lý trong trò chơi, hoặc các thử nghiệm A/B – vốn đòi hỏi câu trả lời tức thì và khả năng lập luận chuyên sâu.




Google cũng nhận được phản hồi rất tích cực từ các doanh nghiệp đang sử dụng Gemini 3 Flash. Những công ty như JetBrains, Bridgewater Associates, và Figma đã bắt đầu ứng dụng Gemini 3 Flash để thúc đẩy chuyển đổi hoạt động kinh doanh khi nhận thấy tốc độ xử lý, hiệu quả và năng lực lập luận của mô hình này đạt mức tương đương với các mô hình có quy mô lớn hơn. Hiện nay, Gemini 3 Flash đã sẵn sàng cho khách hàng doanh nghiệp thông qua Vertex AI và Gemini Enterprise.

Dành cho tất cả mọi người: Gemini 3 Flash đang được triển khai trên toàn cầu
Gemini 3 Flash hiện đã trở thành mô hình mặc định trong ứng dụng Gemini, thay thế cho phiên bản 2.5 Flash. Điều này đồng nghĩa với việc người dùng Gemini trên toàn cầu có thể trải nghiệm phiên bản Gemini mới mà không mất phí, giúp nâng cấp các tác vụ hằng ngày.
Nhờ khả năng lập luận đa phương thức mạnh mẽ của Gemini 3 Flash, bạn có thể sử dụng công cụ này để tiếp nhận, phân tích và xử lý nhiều loại thông tin khác nhau với tốc độ nhanh chóng. Chẳng hạn, bạn có thể yêu cầu Gemini phân tích video hoặc hình ảnh và chuyển nội dung đó thành một kế hoạch chi tiết, có thể áp dụng ngay, chỉ trong vài giây.

Hoặc bạn có thể nhanh chóng tạo ra những ứng dụng vừa thú vị vừa hữu ích từ đầu chỉ bằng giọng nói, ngay cả khi chưa có nhiều kinh nghiệm lập trình. Chỉ cần trò chuyện với Gemini, kể cả khi đang di chuyển, Gemini sẽ chuyển những ý tưởng còn rời rạc của bạn thành một ứng dụng hoàn chỉnh chỉ trong vài phút.

Gemini 3 Flash đang dần được triển khai làm mô hình mặc định cho AI Mode trong Google Tìm kiếm, áp dụng cho người dùng trên toàn cầu.
Dựa trên khả năng lập luận của Gemini 3 Pro, AI Mode với Gemini 3 Flash có khả năng thấu hiểu tốt hơn những sắc thái trong từng câu hỏi của bạn. Mô hình phân tích kỹ lưỡng mọi khía cạnh của truy vấn để đưa ra các phản hồi sâu sắc, toàn diện, được trình bày theo bố cục trực quan, dễ theo dõi. Đồng thời, hệ thống liên tục cập nhật thông tin địa phương theo thời gian thực và các liên kết hữu ích từ khắp nơi trên internet. Kết quả này là sự kết hợp hoàn hảo giữa việc nghiên cứu thông tin và hành động tức thì: bạn nhận được phần phân tích được sắp xếp thông minh đi kèm các đề xuất cụ thể – tất cả diễn ra với tốc độ tương đương công cụ Tìm kiếm.
Năng lực này sẽ phát huy hiệu quả rõ rệt khi bạn có một mục tiêu phức tạp với nhiều yếu tố cần cân nhắc. Chẳng hạn như nỗ lực lên kế hoạch cho một chuyến đi vào phút chót hay nhanh chóng tiếp thu các khái niệm học thuật khó.
Gemini 3 Flash đưa khả năng lập luận mạnh mẽ của Gemini 3 vào Tìm kiếm mà vẫn đảm bảo tốc độ, giúp bạn xử lý cả những câu hỏi phức tạp nhất một cách nhanh chóng.
Gemini 3 Flash mang đến khả năng lập luận tuyệt vời của Gemini 3 cho chức năng Tìm kiếm, mà không làm giảm tốc độ, giúp bạn giải quyết những câu hỏi phức tạp nhất.
Trải nghiệm Gemini 3 Flash ngay hôm nay
Gemini 3 Flash hiện đã được cung cấp dưới dạng bản xem trước thông qua Google Antigravity, Vertex AI và Gemini Enterprise. Bạn cũng có thể truy cập Gemini 3 Flash thông qua các công cụ dành cho nhà phát triển khác như Gemini CLI và Android Studio. Bên cạnh đó, Gemini 3 Flash đang bắt đầu được triển khai cho tất cả người dùng trên ứng dụng Gemini và AI Mode trong Google Tìm kiếm, mang đến khả năng tiếp cận nhanh chóng với trí tuệ thế hệ mới hoàn toàn miễn phí.
Google rất mong chờ được thấy những điều bạn sẽ hiện thực hóa cùng hệ sinh thái Gemini ngày càng mở rộng, bao gồm Gemini 3 Pro, Gemini 3 Deep Think và nay là Gemini 3 Flash.












