Sản phẩm

Google ra mắt Nano Banana Pro

  [tintuc]

Google ra mắt Nano Banana Pro: AI tạo ảnh “đọc được chữ”, làm infographic và chỉnh sửa như máy ảnh




Google vừa giới thiệu Nano Banana Pro, mô hình AI mới chuyên tạo và chỉnh sửa ảnh, được hãng mô tả là phiên bản “tân tiến nhất” từng ra mắt. Điểm nhấn lớn nhất của Nano Banana Pro nằm ở việc giảm lỗi chữ/văn bản – bài toán vốn gây khó cho nhiều công cụ AI tạo ảnh – đồng thời nâng cấp khả năng làm infographic, slide thuyết trình và duy trì tính nhất quán thiết kế.

Tập trung giải bài toán chữ và thiết kế nhất quán

Nano Banana Pro được phát triển dựa trên Gemini 3 Pro, với các cải tiến xoay quanh:

  • Văn bản rõ, đúng chính tả, dễ đọc, hỗ trợ đa ngôn ngữ và cả hiệu ứng/bố cục chữ phục vụ thiết kế.

  • Chỉnh sửa ảnh thông minh hơn: đổi góc chụp, tỷ lệ khung hình, màu sắc, lấy nét, ánh sáng… như thao tác với máy ảnh.

  • Giữ tính nhất quán hình ảnh: người dùng có thể đưa nhiều ảnh tham chiếu để mô hình sắp xếp theo yêu cầu và vẫn giữ đặc điểm nhận diện của một số ảnh quan trọng (ví dụ gương mặt, thần thái bạn bè, gia đình, thú cưng…).

Trải nghiệm trên Gemini và mở rộng sang nhiều sản phẩm

Người dùng có thể thử Nano Banana Pro trong ứng dụng Gemini bằng cách chọn Tạo hình ảnh > Tư duy. Theo thông tin được chia sẻ, tài khoản miễn phí sẽ có số lượt sử dụng giới hạn, sau đó có thể quay về phiên bản cũ.

Google cũng dự kiến tích hợp Nano Banana Pro vào NotebookLM, đồng thời mở rộng cho các nhóm nhà phát triển, doanh nghiệp và nhà sáng tạo nội dung. Tại Mỹ, mô hình này còn được thử nghiệm trong chế độ AI của Google Search dành cho người dùng các gói cao hơn. Ngoài ra, Nano Banana Pro được cho là sẽ xuất hiện trong một số công cụ thiết kế phổ biến như Canva, Figma và Photoshop.

Tạo infographic và trực quan hóa dữ liệu tốt hơn

Với khả năng lập luận nâng cao từ Gemini 3, Nano Banana Pro hướng tới các tác vụ “vừa đẹp vừa đúng” như:

  • Biến công thức nấu ăn thành biểu đồ minh họa trực quan.

  • Trực quan hóa dữ liệu “thời gian thực” như thời tiết hoặc thể thao dưới dạng hình ảnh dễ hiểu.

  • Tạo slide thuyết trình có bố cục đồng bộ, chữ dễ đọc, phù hợp dùng ngay cho nội dung truyền thông.

SynthID, watermark và kế hoạch mở rộng sang âm thanh – video

Google cho biết ảnh tạo từ Nano Banana Pro sẽ được gắn SynthID ẩn để nhận diện nội dung do AI tạo. Trên Gemini, người dùng cũng có thể tải ảnh lên và hỏi xem hình ảnh đó có phải do AI của Google tạo hay không. Hãng đặt mục tiêu mở rộng cơ chế nhận diện này sang âm thanh và video trong tương lai.

Về hiển thị, ảnh tạo bởi mô hình vẫn có thể kèm watermark ở các gói miễn phí hoặc cấp thấp hơn; watermark sẽ được gỡ ở gói thuê bao cao cấp.

Động thái cạnh tranh trong cuộc đua AI tạo sinh

Nano Banana từng thu hút chú ý nhờ khả năng tạo ảnh người, thú cưng và phong cảnh có độ chân thực cao. Đại diện Google cho biết phiên bản Pro được cải thiện rõ ở các nhu cầu “thực dụng” hơn như infographic, slidetính đồng nhất giữa nhiều hình ảnh – những yếu tố quan trọng với người làm nội dung.

Trong bối cảnh cuộc đua AI tạo sinh ngày càng nóng, Google cho biết nhu cầu sử dụng các gói AI tăng mạnh và công ty đang tiếp tục mở rộng danh mục thử nghiệm, gồm cả những sản phẩm như Flow (làm phim) và Genie (tạo thế giới ảo).


[/tintuc]

Tags: tin-tuc
Danh mục