Jak korzystać ze Stable Diffusion 3 na komputerze: praktyczny przewodnik

Ostatnia aktualizacja: 20/11/2025
Autor: Isaac
  • Stable Diffusion jest darmowy, lokalny i rozszerzalny dzięki modelom i VAE umożliwiającym precyzyjne dostrajanie stylów i motywów.
  • Dzięki Easy Diffusion instalacja i użytkowanie są prostsze, a sterowanie odbywa się za pomocą kluczowych komunikatów i parametrów.
  • Wydajność zależy od procesora graficznego i pamięci VRAM; kluczowe znaczenie ma dostosowanie rozmiaru, liczby kroków i próbnika.

Narzędzie AI do tworzenia obrazów na komputerze

La sztuczna inteligencja W odniesieniu do wizerunku, wkradł się on do naszego codziennego życia i, chociaż budzi kontrowersje, jest już potężnym narzędziem pracy. Stabilna dyfuzja 3 Jest częścią tej fali i wyróżnia się tym, że pozwala tworzyć obrazy z tekstu bezpośrednio na komputerze, bez konieczności korzystania z usług w chmurze i z ogromną kontrolą nad każdym parametrem.

W tym artykule pokażemy Ci w praktyce, jak uruchomić tę aplikację na Twoim komputerze za pomocą prostego interfejsu. Łatwe rozpowszechnianie, jaki sprzęt jest Ci potrzebny, jak dostosować jego opcje oraz jak zainstalować modele i dodatki, aby w pełni wykorzystać jego możliwości. Wszystko wyjaśnione w jasnym tonie, z Tricks i zawiadomienia dzięki czemu od samego początku będziesz mógł generować obrazy o dobrych wynikach.

Czym jest stabilna dyfuzja (i dlaczego wersja 3 jest ważna)

Stabilna dyfuzja to model generowanie obrazów z tekstu Jego sukces wynika z otwartości, darmowego i lokalnie wykonywalnego kodu źródłowego. W porównaniu z alternatywami takimi jak Midjourney czy DALL·E, jego największą zaletą jest możliwość pobrania, dostosowania i rozbudowy o własny katalog szablonów i rozszerzeń. Otwarta Filozofia To jest klucz: Ty decydujesz, co zainstalować, jak to dostosować i gdzie to ma działać.

Chociaż w tym artykule skupimy się na sposobie korzystania z programu na komputerze z przyjaznym dla użytkownika interfejsem, ważne jest, aby podstawowe koncepcje (monity, kroki wnioskowania, próbnik, rozmiar, przewodnik itp.) były takie same jak w rodzinie Stable Diffusion. Jeśli Twoim celem jest użycie Stable Diffusion 3Te kroki będą działać tak samo, ponieważ działanie interfejsu i przepływ pracy nie ulegają zmianie: wybierasz zgodny model, definiujesz dane wejściowe i dostosowujesz parametry, aby dopracować wynik.

Warto pamiętać o kontekście: IA Jest wszędzie, od DLSS z NVIDIA który zmienia skalę i generuje klatki, wykorzystując techniki uczenia maszynowego, aż do projektów takich jak Demuks do oddzielania utworów muzycznych lub generatorów obrazów, takich jak Midjourney i DALL·ETymczasem toczą się dyskusje na temat jego wykorzystania, a kraje takie jak Włochy podjęły w przeszłości działania w odniesieniu do niektórych usług. Pomijając kontrowersje, postęp techniczny jest niezaprzeczalny. Stabilna dyfuzja jest tego wyraźnym przykładem.

Interfejs do generowania obrazów z dyfuzją stabilną

Kolejną ciekawą zaletą tego ekosystemu jest to, że możesz tworzenie i scalanie niestandardowych modeli aby dostosować je do bardzo specyficznych stylów lub tematów (portrety, architektura, pejzaże itp.). Ta swoboda, w połączeniu z możliwością realizacji w terenie, pozwala na bezpieczne eksperymentowanie we własnym tempie.

Minimalne i zalecane wymagania dla Twojego komputera

Korzystanie ze Stable Diffusion z wizualnym interfejsem nie jest już skomplikowane. Dzięki instalatorowi z przewodnikiem instalacja przebiega bardzo podobnie do instalacji dowolnego innego programu. Minimalne wymagania Są niedrogie, ale korzystanie z nich jest zauważalnie lepsze w przypadku korzystania z dobrej karty graficznej.

Aby zacząć, potrzebujesz tylko jednego CPU, 8 GB pamięci RAM i przynajmniej 25 GB miejsca na dysku dla programu i jego plików pomocniczych. Możesz wymusić renderowanie na procesorze tylko wtedy, gdy nie masz dedykowanej karty graficznej, chociaż będzie to wolne i ograniczy Cię do niższych rozdzielczości. Przydatne do testowania i zapoznawania się. z narzędziem, to na pewno.

Jeśli Twój komputer ma zintegrowaną kartę graficzną, upewnij się, że posiada ona: 2 GB dedykowanej pamięciW systemach ze skromną mocą procesora graficznego iGPU, warto polegać wyłącznie na procesorze, aby uniknąć wąskich gardeł. Nie jest to idealne rozwiązanie do produkcjiAle pozwala zacząć.

Aby zapewnić płynną pracę, zalecana jest dedykowana karta graficzna NVIDIA lub AMD. 2 GB pamięci VRAM Działa, ale jeśli chcesz generować większe, bardziej szczegółowe obrazy w rozsądnym czasie, realistycznym celem jest dążenie do 8 GB pamięci VRAM lub więcej. Im więcej pamięci posiadasz, tym szybszy i bardziej elastyczny będzie proces., oprócz włączania zaawansowanych opcji podczas renderowania.

Jeśli chodzi o model GPU, każda nowoczesna karta będzie odpowiednia, a posiadanie jej jest pomocne. szybka magistrala pamięciNależy pamiętać, że interfejs ten nie wykorzystuje zalet rdzeni Tensor firmy NVIDIA ani ich odpowiedników AMD: Obliczenia opierają się na możliwościach rasteryzacji karty, a nie w dedykowanych akceleratorach AI.

  Czym jest symulator Velxio i w jaki sposób rewolucjonizuje emulację Arduino, ESP32 i Raspberry Pi?

Instalacja krok po kroku z Easy Diffusion (Windows)

Chociaż Stable Diffusion jest wieloplatformowy i można go używać także w Linux lub macOS, skupmy się tutaj na Windows aby uprościć. Instalator poprowadzi Cię i nie ma w tym prawie żadnej tajemnicy.

  1. Pobierz instalator z oficjalnego repozytorium (GitHub) i wybierz odpowiedni system operacyjny (w tym przypadku Windows). Upewnij się, że pobierasz najnowszą stabilną wersję aby uniknąć problemów z zależnościami.
  2. Uruchom instalator i naciskaj „Dalej”, aby kontynuować. Kreator zajmie się utworzeniem struktury folderów i przygotowaniem niezbędnych skryptów. Nie zamykaj okna, jeśli widzisz, że to chwilę potrwa.Jest to normalne podczas pierwszej instalacji.
  3. Wybierz lokalizację w urządzeniu, w którym chcesz go zainstalować. Zaleca się umieszczenie go w folder główny dysku (na przykład C:\EasyDiffusionFolderName), aby uniknąć zbyt długich ścieżek. Instalator pobierze dodatkowe pliki Może to chwilę potrwać. Zaznacz pole, aby utworzyć skrót, jeśli jest ono dostępne.

Kiedy to się skończy, będziesz mógł Uruchom Stable Diffusion ze skrótu na pulpicie lub uruchomienie scenariusz „Uruchom stabilny interfejs użytkownika Diffusion” w folderze instalacyjnym. Jeśli poprosi o uprawnienia, zaakceptuj je tak aby serwer lokalny boot bez blokowania.

Uruchamianie i uzyskiwanie dostępu do interfejsu

Po otwarciu aplikacji zobaczysz czarne okno CMD który pozostanie aktywny podczas użytkowania. Nie zamykaj go: to on uruchamia serwer i pokazuje postęp oraz wszelkie powiadomienia. Jeśli chcesz całkowicie opuścić programZamknij to okno.

Gdy wszystko będzie gotowe, Twoja domyślna przeglądarka otworzy interfejs internetowy. Jeśli tak się nie stanie lub wolisz korzystać z innej przeglądarki, zaloguj się ręcznie. http://localhost:9000/. Pierwszy raz może potrwać ponieważ weryfikuje pliki i pobiera brakujące elementy; jeśli jest dostępna aktualizacja, czas rozruchu będzie dłuższy.

Interfejs podzielony jest na zakładki. Najważniejsze z nich to: 'Spowodować' (tworzyć obrazy) i "Ustawienia" (aby dostosować wydajność i zachowanie). Znajdziesz tu również „Pomoc i społeczność” (z linkami do zasobów i samouczków), „Połącz modele” (do łączenia modeli) i „Co nowego?” (dziennik zmian aplikacji). Nowe karty pojawiają się często z aktualizacjami.

Spójrz na prawy górny róg interfejsu: jest tam wskaźnik stanu który powiadamia Cię, jeśli renderuje się lub wystąpił błąd. Przydatne do sprawdzenia na pierwszy rzut oka. jeśli kolejka zadań jest nadal aktywna.

Ustawienia kluczowe przed rozpoczęciem (zakładka Ustawienia)

Przed utworzeniem czegokolwiek warto sprawdzić „Ustawienia”. Kilka zmian może mieć duże znaczenie w przypadku słabszych systemów. Zapisz po każdej zmianie aby ustawienie zaczęło obowiązywać.

  • Automatyczne zapisywanie obrazów: Włącza automatyczne zapisywanie wszystkich wygenerowanych obrazów. Możesz wybrać katalog docelowy i format metadanych. Unikaj utraty wyników gdy robisz długie testy.
  • Blokuj obrazy NSFW:Po włączeniu tej opcji treści dla dorosłych będą rozmyte. Przydatne, jeśli pracujesz w środowiskach współdzielonych lub potrzebujesz ścisłej moderacji.
  • Wykorzystanie pamięci GPU: definiuje, ile pamięci VRAM należy użyć. „Niska” dla kart graficznych o pojemności 2–4 GB, „Zrównoważona” dla kart o pojemności 4–8 GB i „Szybka” dla kart o pojemności powyżej 8 GB. Zmiana tej opcji zapobiega błędom pamięci. i zawiesza się w trakcie renderowania.
  • Użyj procesora: wymusza użycie wyłącznie procesora. Jest to przydatne, jeśli nie masz dedykowanego procesora graficznego, ale jest wolne. Nie aktywuj tej opcji, jeśli masz kartę graficzną.ponieważ nie można używać obu jednocześnie.
  • Potwierdź niebezpieczne działania: żąda potwierdzenia podczas usuwania plików lub wykonywania poufnych operacji w obrębie interfejsu. Oszczędza Ci strachu podczas pracy z partiami.
  • Udostępnij stabilną dyfuzję w swojej sieciWłącza tryb serwera, aby umożliwić dostęp z innych urządzeń w sieci lokalnej poprzez określenie adresu IP i portu. Na dole zobaczysz 'Adresy serwerów' z dokładnym adresem, którego należy użyć. Idealny do robienia renderów z laptopa lub tabletu.

Za każdym razem, gdy zmieniasz dowolny parametr w „Ustawieniach”, naciśnij 'Zapisać' (poniżej listy), aby zastosować zmiany. Poniżej zobaczysz podsumowanie sprzęt komputerowy, przydatne do potwierdzenia, że ​​GPU został wykryty.

Generowanie obrazów: monity, negatywy i kolejka renderowania

Podstawowy przepływ pracy jest prosty: wpisz, co chcesz wygenerować, w polu „Enter Prompt”. Narzędzie lepiej rozumie język angielski, więc w razie potrzeby pisz po hiszpańsku i przepuść to przez tłumaczaNastępnie wklej wersję angielską. Im tekst jest bardziej przejrzysty i szczegółowyIm większą kontrolę będziesz mieć nad wynikiem.

  Co to jest plik IMG? Do czego służy i jak go otworzyć

Poniżej znajduje się „Monit negatywny”, w którym należy wskazać, co nie chcesz, żeby się pojawiło (na przykład: „rozmazane, mało szczegółowe, dodatkowe palce”). Negatywy są złotem aby rozwiązać typowe problemy i wyczyścić urządzenia.

Gdy już to masz, naciśnij główny przycisk 'Stwórz obraz' Aby dodać zadanie do kolejki, możesz kontynuować dostosowywanie opcji lub przygotowywanie innych poleceń podczas renderowania. Status zobaczysz w górnym rogu i w oknie CMD.

Należy pamiętać, że chociaż istnieją zalecane wartości, Wyniki różnią się w zależności od modelu i komunikatuWypróbuj kombinacje, zapisz warianty i porównaj. Eksperymentowanie Jest to istotna część procesu.

Parametry obrazu, które powinieneś opanować

Pod przyciskiem zobaczysz kilka rozwijanych menu z parametrami. Kontrolowanie ich stanowi różnicę między dobrym szkicem a wysokiej jakości obrazem. Poniżej znajdują się te najbardziej istotne i jak wpływają na wynik:

  • Nasienie: ziarno losowości. W przypadku opcji „Losowo” ziarno losowości zmienia się przy każdym renderowaniu. Jeśli chcesz odtworzyć wynik lub generować subtelne wariacje, ustalić konkretne ziarno.
  • Liczba zdjęć:dwie wartości. Pierwsza to całkowita liczba obrazów wygenerować i po drugie, ile jest przetwarzanych równolegleGenerowanie równoległe maksymalizuje wykorzystanie pamięci VRAM (przydatne przy 16–24 GB), ale zużywa znaczne zasoby. Ważne: Upewnij się, że liczba równoległa jest wielokrotnością całkowitej liczbyW przeciwnym wypadku renderowanie może się zawiesić i konieczne będzie ponowne uruchomienie komputera.
  • ModelWybierz model dyfuzji stabilnej spośród zainstalowanych. Istnieją modele ogólne i inne specjalistyczne według stylu lub motywu. Zmiana modelu radykalnie zmienia estetykę.
  • Niestandardowy VAE:dodatkowe moduły, które konkretne aspekty ulegają poprawie obrazu (oczy, twarze, tekstury itp.). Możesz aktywować konkretny element, jeśli model to zaleca.
  • PróbnikAlgorytm próbkowania, który usuwa szum w celu utworzenia obrazu końcowego. Niektóre samplery Oni nie są deterministami A jego wydajność różni się w zależności od innych parametrów. Jeśli nie masz pewności, wypróbuj kilka i wybierz ten, który najlepiej sprawdza się w Twoim modelu.
  • Wielkość obrazuSzerokość i wysokość w pikselach. Zachowaj Format 1: 1 Zwykle daje bardziej spójne rezultaty. Zwiększenie rozdzielczości zwiększa zużycie pamięci VRAM i El Tiempo wykonanie.
  • Kroki wnioskowania: liczba kroków wnioskowania. Ogólnie rzecz biorąc, większa liczba kroków oznacza więcej szczegółówIstnieje jednak punkt malejących korzyści, który zależy od próbnika i modelu. Eksperymentuj z rozsądnymi zakresami.
  • Skala wskazówekJak dokładnie sztuczna inteligencja podąża za Twoim poleceniem. Wysokie wartości podążają za Twoim poleceniem. dosłownie dyrektywy, podczas gdy niższe wartości pozwalają na większą „kreatywność” w modelu.
  • Hipersieć: modyfikatory, które Przeformułowują lub udoskonalają polecenie aby dostosować go do określonego stylu. Przydatne do stabilizacji wyników w trudnych tematach.
  • Format wyjściowyFormat pliku wyjściowego (PNG, JPG itp.). Wybierz w zależności od potrzeb dotyczących przezroczystości lub kompresji. Ma to wpływ na wynikowy pliknie dla procesu wnioskowania.
  • Jakość obrazu: jakość formatu przy użyciu kompresji (np. JPG). Nie zmienia ona samego generowanego obrazu, a jedynie jak oszczędzać.
  • Ustawienia renderowaniaTutaj możesz zobaczyć podgląd procesu (zużywa pamięć VRAM, należy unikać w systemach o niskiej wydajności), aktywować naprawa twarzy i oczu, Zastosować skalowanie z żądanym współczynnikiem i metodą i wybierz wyświetlanie tylko skalowanego obrazu.

Modyfikatory stylu i znaczniki wizualne

Sekcja modyfikatorów dodaje predefiniowane znaczniki stylu: realistyczny, komiksowy, akwarelowy itp. Chociaż pojawiają się one w języku angielskim, Ikony pomagają intuicyjnie ocenić efektUżyj ich jako punktu wyjścia, a jeśli potrzebujesz czegoś bardzo konkretnego, Wspomnij o stylach lub artystach w samym poleceniu aby jeszcze bardziej go udoskonalić.

Te modyfikatory nie obejmują wszystkich możliwości modelu: to skróty. Połączenie ich z dobrze napisanymi podpowiedziami (i trafnymi negacjami) zazwyczaj aby wprowadzić różnicę w spójności wynik końcowy.

Co zrobić z obrazami, które już zostały wygenerowane

Po najechaniu kursorem myszy na miniaturę pojawia się kilka opcji. „Użyj jako danych wejściowych” Możesz ponownie wykorzystać te same ustawienia tego obrazu, aby wygenerować warianty lub go zmodyfikować. „Twórz podobne obrazy” Uruchamiasz grupę podobnych obrazów, nie dotykając niczego innego. Są to punkty szybkiego dostępu aby powtarzać wątek bez jego utraty.

Przycisk pobierania umożliwia pobranie obrazu w wybranym formacie, a jeśli zależy Ci na pełnej reprodukcji, pobierz plik JSON ze wszystkimi metadanymi renderowania (monit, ziarno, próbnik, kroki itp.). Doskonale nadaje się do procesów archiwizacji gdy współpracujesz z innymi ludźmi.

  Jak naprawić wysokie użycie procesora przez svchost.exe?

"Narysuj kolejne 25 krokówProces ten powtarza się dla tego samego obrazu przez kolejne 25 kroków, co jest przydatne w przypadku polskie szczegóły bez konieczności zaczynania od zera. I możliwość 'ekskluzywny' Rozpocznie się skalowanie, jeśli nie zostało ono włączone w poprzedniej konfiguracji.

Generuj ze zdjęć lub szkiców

Oprócz tekstu możesz podać zdjęcie referencyjne. Prześlij zdjęcie ze swojego komputera lub Wybierz jeden z już wygenerowanych aby to przekształcić. Z opcją 'Rysować' Możesz także wykonać szybki szkic i poprosić sztuczną inteligencję, aby użyła go jako przewodnika. Połącz wskazówki wizualne i podpowiedzi odblokowuje rezultaty, których nie można osiągnąć za pomocą samego tekstu.

Jednak wyniki mogą się znacznie różnić w zależności od modelu i konfiguracji. Na początku trudno się w tym połapać.Wypróbuj różne intensywności przewodnika, zmień sampler lub kroki i porównaj. Zapisywanie wariantów pomaga zrozumieć, co poprawia każda zmiana.

Zainstaluj nowe modele, VAE i inne dodatki

Ekosystem Stable Diffusion wyróżnia się dzięki swojej społeczności modeli. Możesz pobierać pliki. .ckpt lub .safetensors z wersjami i stylami przeznaczonymi do różnych zadań. Istnieją modele „ogólne” oraz inne, specjalizujące się w ludziach, budynkach, ilustracjach itp.

Jednym z najpopularniejszych źródeł jest CivitAIChoć jest ich o wiele więcej. Bezpieczeństwo jest tu kluczowe: zawsze analizuj pliki i pobieraj je tylko z zaufanych witryn, ponieważ istnieje możliwość ich ukrycia. malware w manipulowanych modelach. Ostrożność przede wszystkim gdy dodajesz do swojego urządzenia treści pochodzące od stron trzecich.

Oprócz modeli podstawowych można zainstalować hipersieci, VAE i inne wtyczki, które korygują lub podkreślają określone obszary (na przykład oczy lub skórę). Aby je zainstalować, skopiuj każdy plik do folderu „Models” w Easy Diffusion, w odpowiedni podfolder do swojego typu. W każdym podfolderze zobaczysz plik tekstowy wskazujący jakie rozszerzenia obsługuje?.

Jeśli kiedykolwiek zechcesz odinstaluj aplikacjęPo prostu usuń folder instalacyjny. Podczas pracy lokalnej, nie pozostały żadne usługi resztkowe ani procesów w tle.

Wskazówki dotyczące wydajności i najlepsze praktyki

Jeśli w systemie brakuje pamięci VRAM, priorytetowo potraktuj najważniejsze czynności: obniż rozmiar obrazu, zmniejsz liczbę kroków i ustaw opcję „Zrównoważone” lub „Niskie” w opcji „Wykorzystanie pamięci GPU”. Unikaj podglądu na żywo podczas renderowania, ponieważ zużywa dodatkową pamięć.

Aby uzyskać ostrzejsze obrazy, rozważ pracę przy niższych rozdzielczościach, a następnie zastosuj skalowanie w góręDostosuj „Skalę wskazówek”, jeśli zauważysz, że sztuczna inteligencja „zmyśla” lub odwrotnie, jeśli jest zbyt sztywna i nie eksploruje. Małe zmiany Mają duży wpływ na styl.

Dokumentuj swoje testy: zapisz ziarno i metadane, gdy znajdziesz coś, co działa. Plik JSON Każdy obraz jest Twoim najlepszym przyjacielem, jeśli chodzi o odtwarzanie i udostępnianie procesów innym użytkownikom.

Interfejs, pomoc i społeczność

Zakładka „Pomoc i społeczność” Oferuje linki do zasobów i samouczków związanych z aplikacją i ekosystemem. Jeśli chcesz wziąć udział, /r/StableDiffusion To nieoficjalna społeczność skupiająca się na materiałach typu open source: możesz tam publikować dzieła sztuki, otrzymywać odpowiedzi na pytania, dyskutować, wnosić wkład w nową technologię, a także po prostu przeglądać zasoby. Społeczność jest bardzo aktywna Znajdziesz tu wszystko, od podstawowych przewodników po wątki techniczne.

Pamiętaj, że niektóre witryny i usługi, w których udostępniana jest dokumentacja branżowa lub ogłoszenia (np. LinkedIn), będą Cię o to prosić zgoda na pliki cookie oferować, chronić, analizować i ulepszać swoje usługi, w tym ogłoszenia zawodowe i o pracę zarówno na platformie, jak i poza nią. Możesz akceptować lub odrzucać pliki cookie, które nie są niezbędne, Zmień swoje preferencje w dowolnym momencie z poziomu ustawień, zgodnie ze szczegółowymi informacjami zawartymi w polityce plików cookie.

Jeśli dotarłeś aż tutaj, wiesz już, co jest potrzebne do uruchomienia Stable Diffusion 3 na Twoim komputerze, jak zainstalować prosty interfejs, jakie parametry naprawdę wpływają na wynik oraz jak dodawać modele i wtyczki, nie przejmując się tym zbytnio. Rzeczywisty przepływ pracy polega na iterowaniu, porównywaniu i komentowaniu.Dzięki dobremu połączeniu podpowiedzi, negatywów, próbek i kroków, a także kilku dobrze dobranym obrazom VAE, przejdziesz od szkiców do solidnych obrazów w krótszym czasie, niż myślisz.