NVIDIA udostępnia FLUX.1 Kontext jako mikrousługę NIM – edycja obrazów AI z 2x przyspieszeniem

1 miesiąc temu

NVIDIA wspólnie z Black Forest Labs udostępniła FLUX.1 Kontext [dev] w formie mikrousługi NIM, znacząco ułatwiając implementację zaawansowanych narzędzi do edycji obrazów opartych na AI. Dzięki kwantyzacji model zmniejszył swój rozmiar z 24 GB do 7 GB dla najnowszych układów RTX 50 Series, zapewniając jednocześnie dwukrotne przyspieszenie poprzez technologię TensorRT. Użytkownicy mogą teraz modyfikować zdjęcia używając jedynie prostych instrukcji tekstowych, bez potrzeby stosowania złożonych procedur roboczych.

NVIDIA przedstawiła dostępność modelu FLUX.1 Kontext [dev] w postaci mikrousługi NIM, radykalnie upraszczając proces implementacji zaawansowanych narzędzi do edycji obrazów wykorzystujących AI. Stworzony przez Black Forest Labs model umożliwia użytkownikom modyfikację istniejących obrazów poprzez proste polecenia tekstowe, eliminując konieczność dopasowywania modeli czy złożonych procedur roboczych. W odróżnieniu od konwencjonalnych metod wymagających łączenia różnorodnych narzędzi i sieci sterujących, FLUX.1 Kontext dostarcza jeden zintegrowany model do tworzenia i edytowania obrazów.

Głównym sukcesem jest radykalne zmniejszenie zapotrzebowania na pamięć poprzez kwantyzację modelu. NVIDIA oraz Black Forest Labs współdziałały nad redukcją rozmiaru z pierwotnych 24 GB do 12 GB dla precyzji FP8 zoptymalizowanej dla GPU GeForce RTX 40 Series oraz do jedynie 7 GB dla precyzji FP4 przeznaczonej dla nowych kart RTX 50 Series z architekturą Blackwell. Precyzja FP4 wykorzystuje innowacyjną metodę SVDQuant, która utrzymuje wysoką jakość obrazów pomimo znacznej redukcji wielkości modelu. Ponadto, framework TensorRT gwarantuje ponad dwukrotne przyspieszenie w porównaniu z oryginalnym modelem BF16 działającym w bibliotece PyTorch.

Model zapewnia kontrolowany, stopniowy proces generowania, który ułatwia kierowanie ewolucją obrazu – od niewielkich korekt detali po przekształcenie całej kompozycji. Ponieważ FLUX.1 Kontext przyjmuje zarówno tekst, jak i obrazy jako dane wejściowe, użytkownicy mogą łatwo odnosić się do koncepcji wizualnych i kierować ich rozwojem w intuicyjny sposób. Mikrousługa NIM dostarcza gotowe, zoptymalizowane pakiety dostępne do pobrania jednym kliknięciem poprzez węzły ComfyUI NIM, czyniąc je łatwo dostępnymi dla użytkowników. Wcześniej tego rodzaju spektakularne wzrosty wydajności były dostępne wyłącznie dla specjalistów AI i programistów z głęboką wiedzą o infrastrukturze sztucznej inteligencji.

Aby rozpocząć pracę z FLUX.1 Kontext [dev], użytkownicy muszą zainstalować NVIDIA AI Workbench, pobrać ComfyUI, zainstalować węzły NIM poprzez menedżer ComfyUI oraz zaakceptować licencje modelu na platformie Hugging Face Black Forest Labs. Węzeł automatycznie przygotuje pożądany przepływ pracy i wspomoże w pobraniu wszystkich wymaganych modeli po naciśnięciu przycisku “Uruchom”. Mikrousługi NIM są zoptymalizowane pod kątem wydajności na GPU NVIDIA GeForce RTX i RTX PRO, obejmując popularne modele ze społeczności AI.