Ngày nay, các trình tạo hình ảnh AI đang rất thịnh hành, nhưng hầu hết chúng đều bị giới hạn trong việc tạo hình ảnh ở độ phân giải thấp hoặc phần cứng hết bộ nhớ video. Hiện tại (ít nhất) đã có một cách khắc phục vấn đề này: một phiên bản sửa đổi của Stable Diffusion có tên là “txt2imghd”.
Dự án txt2imghd mới dựa trên chế độ “GOBIG” từ một nhánh khác của Stable Diffusion, đây là mô hình được sử dụng để tạo ra hầu hết tác phẩm nghệ thuật AI mà bạn có thể đã thấy gần đây. Hình ảnh được tạo bằng txt2imghd có thể lớn hơn hình ảnh được tạo bằng hầu hết các trình tạo khác — hình ảnh minh họa là 1536×1536, trong khi Khuếch tán ổn định thường bị giới hạn ở 1024×768 và mặc định cho Midjourney là 512×512 (với tùy chọn nâng cấp lên 1664 x 1664).
Txt2imghd có một cách thông minh để nâng cấp hình ảnh. Theo tài liệu của dự án, nó “tạo ra các hình ảnh chi tiết, có độ phân giải cao hơn bằng cách trước tiên tạo một hình ảnh từ dấu nhắc, nâng cấp nó, sau đó chạy img2img trên các phần nhỏ hơn của hình ảnh được nâng cấp và trộn kết quả trở lại vào hình ảnh gốc.” Đó là một giải pháp thông minh cho các giới hạn của thẻ video, nhưng như bạn có thể mong đợi, kết quả sẽ mất nhiều thời gian hơn để tạo ra một hình ảnh có độ phân giải thấp.
Phiên bản cập nhật có các yêu cầu hệ thống gần giống như Stable Diffusion thông thường, khuyến nghị một card đồ họa có ít nhất 10 GB bộ nhớ video (VRAM). Nếu muốn dùng thử, bạn có thể chạy mô hình trong trình duyệt của mình (cần có tài khoản GitHub miễn phí). Bạn cũng có thể tải xuống mã để chạy trên máy tính của mình từ liên kết nguồn bên dưới.
Nguồn: GitHub