OpenAI giới thiệu mô hình GPT‑4o Image Generation chuyên tạo và sửa hình ảnh

**datlinh02** · 27-03-2025, 08:10 AM

OpenAI vừa tạo nên một bước đột phá mới cho ChatGPT, công cụ AI đình đám của mình. Trong một buổi giới thiệu trực tiếp, CEO Sam Altman đã công bố GPT-4o, bản nâng cấp lớn đầu tiên sau hơn một năm, Image Generation mang đến khả năng tạo và chỉnh sửa hình ảnh trực tiếp ngay trong giao diện trò chuyện quen thuộc. Đây là sự mở rộng đáng kể sức mạnh của mô hình GPT-4o, vốn trước đây chủ yếu tập trung vào xử lý văn bản.

Bước Tiến Vượt Bậc trong Sáng Tạo Hình Ảnh:

Trước bản cập nhật này, dù GPT-4o là trái tim của ChatGPT, khả năng xử lý hình ảnh vẫn còn hạn chế. Giờ đây, người dùng có thể:

Tạo ảnh từ mô tả: Chỉ cần nhập yêu cầu bằng ngôn ngữ tự nhiên, GPT-4o sẽ tạo ra hình ảnh tương ứng. Mô hình mới hứa hẹn mang lại kết quả chi tiết và chính xác hơn so với DALL-E 3 trước đó, ngay cả khi thời gian xử lý có thể lâu hơn (lên đến một phút). Người dùng có thể chỉ định các chi tiết như tỷ lệ khung hình, mã màu hex, hoặc yêu cầu nền trong suốt.
Chỉnh sửa ảnh trực quan: Đây là điểm nhấn đáng chú ý. GPT-4o cho phép người dùng chỉnh sửa các hình ảnh hiện có, kể cả ảnh chân dung. Bạn có thể yêu cầu thay đổi, thêm bớt các yếu tố trong tiền cảnh hoặc hậu cảnh một cách liền mạch và tự nhiên ngay trong cuộc trò chuyện.

Đưa hình ảnh vào (bản vẽ phát thảo)

Đặt yêu cầu

Kết quá có được

Minh Bạch Dữ Liệu và Cam Kết với Nghệ Sĩ

Trong bối cảnh dữ liệu huấn luyện là "bí mật" của nhiều công ty AI, OpenAI đã có động thái đáng chú ý khi tiết lộ một phần nguồn dữ liệu cho GPT-4o. Theo tờ Wall Street Journal, mô hình này được huấn luyện trên cả dữ liệu công khai và dữ liệu cấp phép độc quyền từ các đối tác như Shutterstock.

Tuy nhiên, sự minh bạch này cũng đi kèm những lo ngại về quyền sở hữu trí tuệ. Để giải quyết vấn đề này, OpenAI khẳng định:

Tôn trọng nghệ sĩ: Giám đốc điều hành Brad Lightcap cam kết "tôn trọng quyền của các nghệ sĩ" và có chính sách ngăn chặn việc tạo ra hình ảnh sao chép trực tiếp tác phẩm của nghệ sĩ còn sống.
Cơ chế Opt-out: Cung cấp biểu mẫu cho phép nhà sáng tạo yêu cầu loại bỏ tác phẩm khỏi bộ dữ liệu huấn luyện.
Tôn trọng quyền riêng tư web: Cam kết không thu thập dữ liệu (bao gồm hình ảnh) từ các trang web đã chặn bot thu thập dữ liệu của họ.

Bối Cảnh Cạnh Tranh

Việc nâng cấp của OpenAI diễn ra không lâu sau khi Google thử nghiệm tính năng tạo ảnh trên Gemini 2.0 Flash. Tuy nhiên, sản phẩm của Google đã gặp phải tranh cãi do các vấn đề liên quan đến việc xóa hình mờ và nguy cơ vi phạm bản quyền, cho thấy thách thức trong việc kiểm soát AI tạo sinh hình ảnh.

Thông Tin Triển Khai:

Người dùng: Tính năng tạo ảnh GPT-4o đang dần được triển khai cho người dùng ChatGPT các gói Plus, Pro, Team và cả gói Miễn phí. Người dùng Enterprise và Edu sẽ sớm được tiếp cận.
Nền tảng khác: Tính năng này cũng có sẵn trong mô hình tạo video Sora của OpenAI.
API: Các nhà phát triển sẽ có thể tích hợp khả năng tạo ảnh GPT-4o vào ứng dụng của mình thông qua API trong vài tuần tới.
Lựa chọn khác: Những ai vẫn yêu thích DALL-E 3 có thể tiếp tục sử dụng thông qua GPT DALL·E chuyên dụng.

Tác giả: dân chơi 247
danchoi.com