Xem nhanh
Google đang triển khai các bản nâng cấp toàn diện cho NotebookLM và không ngừng cải tiến ứng dụng Gemini – trợ lý AI cá nhân mạnh mẽ và chủ động cho người dùng.
Những ý chính:
- Google vừa công bố những bước tiến đột phá cho hai công cụ AI cốt lõi là ứng dụng Gemini và NotebookLM nhằm đáp ứng nhu cầu ngày càng cao của người dùng về một trợ lý đa nhiệm thông minh.
- Nhờ việc nâng cấp lên mô hình thế hệ mới Gemini 3.5 Flash, nền tảng này đã chứng kiến sự tăng trưởng vượt bậc với lượng người dùng hoạt động hằng tháng vượt mốc 900 triệu toàn cầu tính đến Sự kiện Google I/O 2026.
- NotebookLM không chỉ hỗ trợ người dùng xây dựng kho tài liệu từ những ý tưởng sơ khai thông qua tích hợp Google Search, mà còn mở rộng khả năng xuất dữ liệu ra nhiều định dạng trực quan phong phú giúp tối ưu hóa quy trình làm việc cho các nhà nghiên cứu, chuyên gia kỹ thuật và chủ doanh nghiệp.
Khi Trí tuệ Nhân tạo (AI) dần trở thành một phần thiết yếu trong đời sống hằng ngày, kỳ vọng của người dùng không còn dừng lại ở những câu trả lời nhanh. Người dùng cần một trợ lý đa nhiệm, có khả năng đồng hành xuyên suốt các tác vụ thường nhật, bao gồm nghiên cứu, học tập, tối ưu hóa hiệu suất làm việc và khơi nguồn sáng tạo. Định hướng này chính là nền tảng để Google phát triển và không ngừng cải tiến ứng dụng Gemini – trợ lý AI cá nhân mạnh mẽ và chủ động cho người dùng.
Gemini – Trợ lý cá nhân hỗ trợ đa tác vụ
Gemini là trợ lý AI của Google, cho phép người dùng trò chuyện, đặt câu hỏi và thực hiện nhiều tác vụ bằng ngôn ngữ tự nhiên trên nền tảng web hoặc thông qua ứng dụng Gemini trên các thiết bị di động. Hiện tại, người dùng có thể sử dụng đa dạng các tính năng trong ứng dụng Gemini cho từng nhu cầu cụ thể như: Deep Research – hỗ trợ lập kế hoạch và tổng hợp báo cáo; Canvas – hỗ trợ viết và biên tập nội dung dài; Gemini Live – cho phép trao đổi bằng giọng nói và hình ảnh theo thời gian thực hay hỗ trợ tạo và chỉnh sửa hình ảnh, tạo nhạc và tạo video.
Sự phát triển từ một công cụ đối thoại sang một trợ lý toàn năng đã thúc đẩy sự tăng trưởng mạnh mẽ của Gemini trên toàn cầu. Số liệu thống kê được công bố tại Sự kiện Google I/O 2026 cho thấy, lượng người dùng hoạt động hằng tháng (MAU) của ứng dụng Gemini đã tăng gấp đôi chỉ trong vòng 12 tháng, chính thức vượt mốc 900 triệu người dùng toàn cầu. Song song đó, lượng yêu cầu xử lý hằng ngày cũng ghi nhận mức tăng trưởng kỷ lục gấp 7 lần.

Trong đó, nổi bật là công cụ tạo và chỉnh sửa hình ảnh trong Gemini, đã ghi nhận hơn 50 tỷ hình ảnh được tạo ra trên toàn thế giới.
Cũng tại Sự kiện Google I/O 2026, Google chính thức giới thiệu Gemini 3.5 Flash – Mô hình đầu tiên trong thế hệ tiếp theo của Gemini, được thiết kế để kết hợp giữa trí thông minh tiên phong và khả năng xử lý tốc độ cao.
Tối ưu hiệu suất làm việc, học tập và nghiên cứu chuyên sâu
Không chỉ hỗ trợ giải đáp các thắc mắc, Gemini được người dùng tìm đến như một “cộng sự” AI, giúp người dùng đi từ bước đặt câu hỏi sơ khởi đến quá trình tìm hiểu chuyên sâu, hệ thống hóa ý tưởng và chuyển hóa thông tin thành nội dung có thể sử dụng trong học tập, công việc và sáng tạo.
Với các đề tài phức tạp, tính năng Deep Research trong ứng dụng Gemini hỗ trợ quá trình nghiên cứu từ bước lập kế hoạch, tìm kiếm đến phân tích và tổng hợp thông tin từ nhiều nguồn trên web thành báo cáo có cấu trúc. Tính năng này có thể được ứng dụng trong các trường hợp như phân tích đối thủ, xây dựng tổng quan ngành hoặc chuẩn bị tài liệu nghiên cứu.

Khi được cấp quyền, Deep Research có thể kết hợp thêm dữ liệu liên quan từ Gmail, Google Drive và Google Chat để điều chỉnh kết quả theo bối cảnh làm việc. Sau đó, Deep Research có thể tạo các báo cáo nghiên cứu tùy chỉnh toàn diện, chứa nhiều thông tin chi tiết và chuyên sâu hơn chỉ trong vài phút và cũng có sẵn dưới dạng một bản Tổng quan bằng âm thanh, giúp bạn tiết kiệm hàng giờ nghiên cứu.
Trên nền tảng kết quả nghiên cứu đó, Canvas giúp cung cấp một không gian làm việc riêng trong Gemini để phát triển và biên tập các tài liệu dài. Thay vì xử lý nội dung ở nhiều công cụ khác nhau, người dùng có thể chỉnh sửa câu chữ, điều chỉnh cấu trúc và hoàn thiện báo cáo, kế hoạch kinh doanh hoặc bài thuyết trình ngay bên cạnh mạch trò chuyện chính với Gemini khi bật tính năng Canvas. Người dùng cũng có thể sử dụng không gian này để tạo infographic, bộ câu đố hay các thẻ nhớ (flashcard).
Với nhu cầu tương tác trực tiếp, Gemini Live trong ứng dụng Gemini cho phép người dùng trò chuyện với Gemini bằng giọng nói, đồng thời chuyển đổi linh hoạt giữa giọng nói và nhập văn bản trong cùng một cuộc trao đổi. Trên thiết bị di động, người dùng cũng có thể chia sẻ hình ảnh qua camera để Gemini phản hồi dựa trên những gì đang nhìn thấy. Ví dụ, người dùng có thể sử dụng câu lệnh bằng giọng nói như “Tái hiện khung cảnh này” để tạo hình ảnh mới bằng mô hình tạo ảnh Nano Banana.
Mở rộng khả năng sáng tạo đa phương thức
Bên cạnh các tác vụ hỗ trợ học tập và làm việc, Gemini cũng cho phép người dùng sáng tạo nội dung trên nhiều định dạng, bao gồm hình ảnh, âm thanh và video. Các công cụ này được tích hợp trong cùng một trải nghiệm, giúp người dùng bắt đầu từ một ý tưởng, sau đó tạo, chỉnh sửa và hoàn thiện nội dung bằng các câu lệnh.
Nano Banana, công cụ tạo và chỉnh sửa hình ảnh trong Gemini, hiện đã ghi nhận hơn 50 tỷ hình ảnh được tạo ra trên toàn cầu. Tại Việt Nam, công cụ này được biết đến qua nhiều trào lưu hình ảnh trên mạng xã hội như “Ảnh chân dung dưới tuyết”, “Ảnh đón Trung thu”, “Phục chế ảnh cũ” và gần đây là “Ảnh chân dung hộp đồ chơi mô hình”. Với Nano Banana, người dùng có thể tạo ảnh, chỉnh sửa bố cục hoặc thay đổi phong cách hình ảnh thông qua các câu lệnh văn bản.

Cùng với đó, Gemini cũng mở rộng khả năng hỗ trợ sáng tạo sang âm nhạc thông qua Lyria, mô hình tạo nhạc của Google DeepMind. Bằng cách mô tả chủ đề, cảm xúc, thể loại nhạc hoặc ý tưởng bằng ngôn ngữ tự nhiên, người dùng có thể tạo bản nhạc gốc, nhạc nền, giai điệu hoặc lời bài hát theo nhu cầu sử dụng. Tính năng này giúp việc tạo nhạc cho video, bài thuyết trình hoặc các dự án sáng tạo cá nhân trở nên dễ tiếp cận hơn, kể cả với người không có nền tảng chuyên môn về âm nhạc.
Đặc biệt, Gemini Omni – mô hình tạo video đột phá mới được công bố tại Google I/O 2026 – đánh dấu bước tiến chuyển mình trong việc sản xuất nội dung đa phương thức. Được xây dựng trên năng lực tư duy logic và khả năng thấu hiểu thế giới quan thực tế của Gemini, Gemini Omni kết hợp hài hòa văn bản, hình ảnh, âm thanh và video để sản xuất ra những thước phim có cốt truyện nhất quán.
Người dùng có thể tinh chỉnh, biên tập nội dung thông qua hội thoại tự nhiên, đồng thời thêm chi tiết, hoặc thậm chí tạo một avatar AI tùy chỉnh có ngoại hình và giọng nói của chính mình trong khi mô hình vẫn đảm bảo sự đồng bộ chặt chẽ về nhân vật, bối cảnh và các yếu tố thị giác qua từng khung hình.
Sự tích hợp các công cụ hỗ trợ cho phép người dùng quản lý nhiều tác vụ trên một nền tảng duy nhất thay vì sử dụng các ứng dụng rời rạc. Để đảm bảo tính an toàn và minh bạch cho tài nguyên số, mọi nội dung được tạo ra đều được bổ trợ bởi công nghệ đóng dấu mờ kỹ thuật số SynthID của Google DeepMind. Công nghệ này đã mã hóa bảo mật cho hơn 100 tỷ hình ảnh, video và 60.000 năm dữ liệu âm thanh, giúp người dùng dễ dàng kiểm tra tính chính danh trực tiếp trong ứng dụng Gemini.
Hiện tại, các tính năng như Deep Research, Canvas, Gemini Live, cùng tính năng tạo ảnh, nhạc và video đều được tích hợp trong ứng dụng Gemini. Nhờ đó, người dùng có thể tiếp cận mọi giải pháp AI tiên tiến này trong cùng một trải nghiệm đồng nhất, phục vụ toàn diện cho nhu cầu nghiên cứu, xử lý công việc và các dự án sáng tạo cá nhân.
NotebookLM – Công cụ AI của Google giúp nghiên cứu hiệu quả và toàn diện với các tính năng mới
Google đang triển khai các bản nâng cấp toàn diện cho NotebookLM, mang đến các khả năng tự vận hành mới và tư duy lý luận tiên tiến hơn để giải quyết các dự án nghiên cứu phức tạp từ tháng 6 năm 2026.
Ra mắt cách đây 3 năm dưới dạng một dự án thử nghiệm từ Google Labs, NotebookLM được định vị là công cụ AI đột phá giúp người dùng tối ưu hóa việc đọc hiểu, tổ chức và xử lý các nguồn thông tin phức tạp. Khác biệt cốt lõi của NotebookLM so với các mô hình tương tự thông thường nằm ở cơ chế hoạt động: công cụ này đóng vai trò như một cộng sự nghiên cứu cá nhân hóa, chỉ phân tích, phản hồi và tương tác dựa trên chính các nguồn dữ liệu tin cậy do người dùng chủ động tải lên (bao gồm tệp tài liệu, PDF, hoặc các liên kết web).

Đến nay, NotebookLM đã phát triển thành một nền tảng nghiên cứu toàn cầu được hàng triệu người tin dùng. Theo số liệu thống kê của Google tính đến năm 2025, Việt Nam nằm trong Top 10 quốc gia có số lượng sử dụng NotebookLM lớn nhất toàn cầu, đồng thời dẫn đầu về số lượt xem các sổ tay tài liệu được chia sẻ công khai.
“Khi bắt đầu phát triển NotebookLM, một trong những kỳ vọng lớn nhất của tôi là xây dựng một công cụ có khả năng hỗ trợ đắc lực giúp nâng cao tư duy phân tích và viết lách, thúc đẩy việc khai phá dữ liệu và khơi nguồn các ý tưởng sáng tạo. Dù vậy, tầm nhìn cốt lõi từ ngày đầu tiên của chúng tôi chưa từng thay đổi: hỗ trợ con người kiến tạo nên những công trình nghiên cứu sâu sắc, chất lượng và mang lại giá trị cao nhất cho người đọc,” – Ông Steven Johnson, Đồng sáng lập kiêm Giám đốc Sản phẩm NotebookLM cho biết.
Với tinh thần đó, các cập nhật mới nhất cho NotebookLM được thiết kế để giúp người dùng đào sâu hơn vào các nguồn tài liệu, ý tưởng và kho kiến thức cá nhân. Những nâng cấp này giới thiệu khả năng vận hành tác nhân trong tính năng trò chuyện, tối ưu hóa tư duy lập luận và đa dạng hóa định dạng đầu ra, giúp người dùng giải quyết các dự án nghiên cứu phức tạp với độ sâu và khả năng kiểm soát cao hơn.
Nhiều định dạng đầu ra hơn, khả năng tùy chỉnh tốt từ tháng 6 năm 2026
Đầu tiên, NotebookLM được nâng cấp để vận hành trên Gemini 3.5 và Antigravity. Cải tiến này giúp cung cấp thông tin chính xác, đáng tin cậy hơn, đồng thời tối ưu hóa khả năng hiển thị minh bạch quá trình tư duy của hệ thống.
Giờ đây, mỗi cuốn sổ ghi chép (notebook) đều được trang bị một máy tính đám mây bảo mật cao, cho phép NotebookLM tự viết và chạy mã lập trình. Tính năng này hỗ trợ đắc lực cho bạn trong việc nghiên cứu chuyên sâu và thực hiện các phân tích phức tạp. Hệ thống cũng tích hợp hơn 100 kỹ năng phần mềm được tinh tuyển, mở ra hàng loạt tiềm năng mới giúp bạn thấu hiểu sâu sắc hơn các nguồn tài liệu trong notebook của mình.

Trong các đánh giá so sánh trực tiếp (side-by-side) với phiên bản tiền nhiệm, NotebookLM nâng cấp đạt tỷ lệ vượt trội hơn 65% (vượt mức cân bằng tới 15 điểm phần trăm) trên cả 5 tiêu chí đánh giá cốt lõi. Đặc biệt, hệ thống cho thấy sự tiến bộ vượt bậc trong việc phân tích các tài liệu lớn với tỷ lệ ưu thế hơn 69,9%, đồng thời đạt hiệu suất xuất sắc trong việc nghiên cứu web chuyên sâu và tìm kiếm nguồn tài liệu khi đạt tỷ lệ vượt trội lên tới 78,2% so với hệ thống tiêu chuẩn trước đây.
Người dùng hiện có thể yêu cầu NotebookLM tạo nội dung ở nhiều định dạng hơn và cung cấp hướng dẫn chi tiết để định hướng các nội dung đó. NotebookLM sẽ tổng hợp ngữ cảnh từ các nguồn của người dùng để tạo ra các định dạng hữu ích và chất lượng cao, chẳng hạn như báo cáo PDF có biểu đồ và bảng, bảng tính ngân sách chi tiết và phiếu bài tập được thiết kế riêng cho học sinh – tất cả đều có thể tải xuống trực tiếp từ bảng Studio. Người dùng thậm chí có thể chỉnh sửa sau khi các nội dung đầu ra được tạo. Các định dạng đầu ra mới bao gồm:
- Trực quan hóa dữ liệu và biểu đồ: (png, svg)
- Tài liệu: (PDF, docx, markdown, tệp văn bản)
- Hình ảnh với Nano Banana: (png, jpg, gif)
- Dữ liệu có cấu trúc: (csv, json)
- Microsoft Excel: (xlsx)
- Microsoft PowerPoint: (pptx)
Google dự kiến sẽ bổ sung thêm các định dạng khác trong tương lai, nhằm giúp NotebookLM trở nên hữu ích hơn theo nhiều cách hơn.
Nghiên cứu dễ dàng hơn
Trước đây, NotebookLM phát huy hiệu quả tốt nhất khi người dùng đã có sẵn nguồn tài liệu của riêng mình và nắm rõ dự án. Giờ đây, người dùng có thể bắt đầu với những ý tưởng và câu hỏi còn sơ khai. NotebookLM có thể hướng dẫn người dùng xây dựng kho nguồn tài liệu ngay trong cuộc trò chuyện, giúp việc bắt đầu bất kỳ dự án nào trở nên dễ dàng hơn.

Có thể người dùng muốn tìm các nguồn tài liệu gốc bằng những ngôn ngữ khác để hiểu rõ hơn các góc nhìn mới, hoặc đang tìm kiếm các tác phẩm liên quan của một tác giả vừa được khám phá. NotebookLM thậm chí có thể sử dụng Google Search để tìm các nguồn thông tin liên quan, chất lượng cao trên web và thêm các nguồn đó vào sổ tay của người dùng.
Người dùng vẫn kiểm soát các nguồn được thêm vào sổ tay của mình, để công việc luôn được xây dựng dựa trên những thông tin mà người dùng tin tưởng và tất cả các nguồn tiếp tục được ghi nhận rõ ràng.
Hữu ích hơn trong nhiều tình huống hơn

Dưới đây là một số quy trình làm việc mà những cải tiến này có thể hỗ trợ:
- Nhà nghiên cứu: Một nhà phân tích dữ liệu có thể kết hợp dữ liệu từ nhiều quốc gia với các định dạng không đồng nhất. Để biến những thông tin này trở nên hữu ích, nhà phân tích có thể yêu cầu NotebookLM thực hiện nghiên cứu web để tìm thêm ngữ cảnh, viết mã để tiến hành phân tích dữ liệu chính xác, đồng thời tạo biểu đồ và báo cáo PDF để trình bày kết quả.
- Chuyên gia kỹ thuật: Một quản lý chương trình có thể diễn giải các thông số kỹ thuật phức tạp phục vụ việc tích hợp khách hàng, nhanh chóng chuyển đổi tài liệu kỹ thuật thành một bản hướng dẫn chỉn chu, đơn giản hóa, bộ slide trình bày và lộ trình từng bước cho đội ngũ.
- Chủ doanh nghiệp nhỏ: Một chủ phòng gym có thể triển khai chiến dịch truyền thông và phân tích dữ liệu doanh số thô so với chi tiêu quảng cáo. Bằng cách tính toán tác động tài chính của chiến dịch bằng NotebookLM, chủ doanh nghiệp có thêm cơ sở để quyết định có nên mở rộng sang các thành phố khác hay không.
Các cập nhật này bắt đầu được triển khai trên toàn cầu trên nền tảng web cho tất cả người dùng Google AI Ultra và tất cả khách hàng doanh nghiệp Workspace có AI Ultra Access và AI Expanded Access, và Google dự kiến sẽ mở rộng đến các nhóm người dùng khác trong thời gian tới.












