تورسىز رەسىم سىزدۇرۇش

January 21, 2024


تەخمىنەن ئوقۇش ۋاقتى 9 مىنۇت

بسم الله الرحمن الرحيم

تورسىز شارائىتتا خۇددىي ھەقلىق MidJourney گە ئوخشاش سۈنئىي ئىدراكقا رەسىم سىزدۇرۇش

سۈنئىي ئىدراكنىڭ نۆۋەتتىكى تەرەققىياتىدىن كىشىنى ئەڭ جەلب قىلىدىغان ئىقتىدارى بولسا تېكىستتىن رەسىم ھاسىل قىلىش ئىقتىدارىدۇر. بۇ ئېنگىلىزچە Text-to-Image دەپ ئاتىلىدۇ. نۆۋەتتە بۇ ئىقتىداردا ئەڭ تەرەققىي قىلىپ مېڭىۋاتقان سۈنئىي ئىدراكلاردىن Midjourney ، Stable Diffusion ، DALL-E ۋە Firefly قاتارلىقلار بار. بۇلاردىن ئەڭ سۈپەتلىك رەسىم چىقىرىپ بېرىدىغىنى Midjourney بولۇپ، بۇ مۇلازىمەت Discord قانىلى ھالىتىدە مۇلازىمەت بېرىدۇ. دەسلەپتە چىققاندا ھەقسىز بولۇپ، كېيىن ھەقلىق ھالەتتە مۇلازىم سۇنۇشقا باشلىدى. ئەمما يەنىلا Stable Diffusion ، DALL-E ۋە Firefly قاتارلىقلارغا ئوخشاش نۇرغۇنلىغان مۇلازىمەتلەر مەۋجۇت. بۇلاردىن Stable Dissusion ھەقسىز ۋە كومپيۇتېرىمىزغا قۇرۇپ ئىشلىتىشكە بولىدىغان نۇسخىسى بولۇپ، بۇ باسقۇچلار دەسلەپتە بەكلا مۇرەككەپ ئىدى. ھازىر بۇ باسقۇچلارنى ئاسانلاشتۇرۇپ بېرىدىغان يۇمشاق دىتاللار ياسالدى. خۇددىي ئالدىنقى يازمىمىزدا تىلغا ئالغان LM Studio غا ئوخشىشىپ كېتىدىغان ئۆز كومپيۇتېرىمىزدىلا تورسىز ۋە ھەقسىز ھالەتتە خالىغان رەسىم ھاسىل قىلىش ئىمكانىيتىمىز بار بولغان دىتاللارمۇ چىقىشقا باشلىدى.

بۇلاردىن مەن ئۆزۈم سىناپ باققان ComfyUI دەپ ئاتىلىدىغان تورسىز شارائىتتا رەسىم ھاسىل قىلىش دىتالىنى تونۇشتۇرۇپ ئۆتىمەن.

تونۇشتۇرۇشتىن بۇرۇن شۇنى ئەسكەرتىپ ئۆتۈش كېرەككى, تېكىست ئارقىلىق رەسىم ھاسىل قىلىش مۇلازىمىتى مائارىپ، گۈزەل-سەنئەت قاتارلىق بەك كۆپ ساھالەردە ئىنتايىن مۇھىم قوللىنىش قىممىتگە ئېگە بولۇپ، گرافىك لايىھەلەش، لوگو لايىھەلەش، كىتاپ مۇقاۋىسى لايىھىلەش، كىيىم لايىھەلەش،قۇرۇلۇش لايىھلەش، بىناكارلىق، ئۆي بېزەش، مائارىپ ئۈچۈن كېرەكلىك رەسىملەرنى سىزىش، مۇرەككەپ تېكىستلەرگە رەسىم قىستۇرۇش، كونا ۋە تۇتۇق رەسىملەرنى ئەسلىگە كەلتۈرۈش، يېرتىلىپ كەتكەن رەسىمنىڭ كام يېرىنى تولۇقلاش.. قاتارلىق ئىشلاردا ئىشەنگۈسىز دەرىجىدە ئىشنى قولايلاشتۇرۇپ بېرىدۇ. ئەمما ھازىر تورلاردا كۆپىنچە كىشىلەر بۇ مۇلازىمەتنى مەۋھۇم ئاياللارنىڭ رەسىملىرىنى ھاسىل قىلىش ئۈچۈن ئىشلىتىۋاتىدۇ. ھەقسىز تارقىتىلغان رەسىم ھاسىل قىلىش مودېللىرىدىن مەخسۇس دۇرۇس بولمىغان رەسىملەرنى ھاسىل قىلىش ياسالغانلىرى بار. شۇڭا بۇ ھەقتە ئىزدەنگەندە بۇ نۇقتىغا دىققەت قىلىشىڭىزنى ئۈمۈد قىلىمەن. چۈنكى ھەربىرىمىز قىيامەت كۈنى كۆز نىئمىتىنى نېمىگە ئشىلەتكەنلىكىمىز ھەققىدە سوئال-سوراق قىلىنىمىز. اللە بۇ تېخنىكىنى توغرا يولدا ئىشلىتىشكە نىسىپ قىلسۇن، ئامىن!

ComfyUI

ComfyUI بولسا ئاساسلىق Python تىلىدا يېزىلغان مۇرەككەپ باسقۇچلارنى ئاسانلاشتۇرغان، كۆرۈنۈشلۈك ھالدىلا بىر تەرەپ قىلىشقا بولىدىغان تورسىز رەسىم ھاسىل قىلىش دېتالى بولۇپ، بۇ يۇمشاق دىتال خۇددىي ئالدىنقى يازمىدا كۆرسىتىلگەن LM Studio غا ئوخشاشلا بىر رامكدىن ئىبارەتتۇر. يەنى بىرنەچچە گېگابايتلىق سۈنئي ئىدراك مودېلىنى قاچىلىغان ۋاقتىمىزدىلا ئاندىن نورمال ئىشلەيدۇ.

ComfyUI نىڭ يەنە بىر ئالاھىدىلىكى شۇكى، خالىغان ھالەتتىكى خىزمەت شارائىتىنى ئۆزىمىز ناھايىتى چىرايلىق كۆرۈنۈشلۈك ھالەتتە قۇرىۋالالايمىز. يەنى خۇددىي پروگراممېردەكلا قانداق رەسىم بىرتەرەپ قىلىشىمىز كېرەكلىكى ھەققدىكى قەدەم باسقۇچلارنى ئۆزىمىز لايىھىلىۋالالايمىز. بۇنىڭ ئۈچۈن بىر مەزگىل ئىشلىتىش تەجرىبىسى ۋە داۋاملىق توردىن ئىزدىنىش لازىم. Youtube تىن بۇ ھەقتە بەك كۆپ ئۆگىتىش ۋىديولىرىنى كۆرۈپ ئۆگىنەلەيسىز. تۆۋەندە بىز ComfyUI نى ئىشلتىشىنى قىسقىچە ئۆگىنىپ چىقايلى:

1- ComfyUI نى چۈشۈرۈش ۋە قاچىلاش.

ComfyUI نىڭ GitHub ھېسابىدىن ئەڭ يېڭى نۇسخىسىنى چۈشۈرۈرىمىز. ئادرېسى تۆۋەندىكىچە:

ComfyUI

بۇ بەتتىن ئەڭ يېڭى ھۆججىتىنى چۈشۈرسەك بولىدۇ. چۈشۈرگەندە سىزنىڭ ئېكران كارتىڭىزنىڭ NVidea ياكى ئەمەسلىكىگە دىققەت قىلىڭ. مېنىڭ NVidea بولغانلىقى ئۈچۈن تۆۋەندىكى ئادرېستىكىنى نۇسخسىنى چۈشۈرۈپ مۇۋاپپىقىيەتلىك ئىشلەتتىم:

ComfyUI Windows Version

چۈشۈرۈپ بولغاندىن كېيىن 7z ھۆججىتىنىڭ ئىچىدىكى بارلىق ھۆججەتلەرنى يېشىپ چىقىرىۋالىمىز. ئاندىن باشقا ھېچقانداق يەرگە چېقىلماستىن run_nvidia_gpu.bat دېگەن ھۆججەتنى باسساق، ۋىدوۋسنىڭ CMD بۇيرۇق كۆزنىكى چىقىدۇ. ھېچقانداق كۇنۇپكىنى باسماستىن بىرنەچچە سېكۇنت ساقلاپ تۇرۇش كېرەك. ئاندىن ئاپتۇماتىك تور كۆرگۈچ ئېچىلىپ http://127.0.0.1:8188 بېتى ئېچىلىدۇ. بۇ دەل ComfyUI نىڭ نورمال قاچىلانغان ۋە قوللىنىشقا تەييار بولغانلىقىنى بىلدۈرىدۇ.

ئەگەر سىز ئىكران كارتىڭىزدا ئەمەس CPU دا خىزمەت قىلماقچى بولسىڭىز run_nvidia_gpu.bat نى ئەمەس run_cpu.bat نى ئىككى چەكسىڭىز بولىدۇ.

بۇ جەريانلاردا خاتالىق كۆرۈلسە، خاتا كودىنى كۆچۈرۈپ، ChatGPT ياكى BingChat گە چاپلاپ سورسىڭىز خاتالىقلارنى ھەل قىلىش يولىنى ئىزدەپ تاپالايسىز.

2- مۇۋاپپىق رەسىم ھاسىل قىلىش مودېلىنى يەنى checkpoint ھالىتىدىكى مودېلنى چۈشۈرۈش ۋە توغرا ئورۇنغا كۆچۈرۈپ ئەكىلىش.

checkpoint ھالىتىدىكى مۇۋاپپىق رەسىم ھاسىل قىلىش مودېلىنى سىز بىرنەچچە توربەتتىن سىناپ ئىزدەپ كۆرەلەيسىز. ئەمما خۇددىي ئالدىدا بىز ئەسكەرتىپ ئۆتكىنىمىزدەك، كۆپىنچىسى دۇرۇس بولمىغان رەسىملەرنى ھاسىل قىلىش ئۈچۈن ياسالغان. شۇڭا مەن تۆۋەندىكى بىرخىلىنىلا تەۋسىيە قىلىمەن. سىز ئارتۇقچە ئىزدەپ يۈرۈشىڭىزنىڭ ھاجىتى يوق. چۈشۈرۈش ئادرېسى:

RealVisXL

بۇ مودېلنىڭ ئىسمى RealVisXL V3.0 + Turbo بولۇپ، 6.46 گېگابايت چوڭلىقىدا. بۇ ھۆججەتنى چۈشۈرۈپ بولغاندىن كېيىن، ComfyUI نىڭ ھۆججەت قىسقۇچىنى ئېچىپ تۆۋەندىكى ئورۇندىكى checkpoints دېگەن يەرگە كۆچۈرۈپ ئەكلىشىڭىز كېرەك: ComfyUI_windows_portable\ComfyUI\models\checkpoints

3- ComfyUI دا ئەڭ ئاددىي خىزمەت مۇھىتى قۇرۇۋېلىش. ئەمدى بىز قوزغىتىلغان ComfyUI بېتىدىكى بارلىق كۆزنەكلەرنى تاقىۋېتىپ، ئەڭ ئاددىي بىر خىزمەت مۇھىتى قۇرىۋالىمىز.

  • ئىكراننىڭ بوش يېرىگە ئېكىلىپ مائۇسنىڭ سول كۇنۇپكىسىنى ئىككى باسساق بىر ئىزدەش ستونى ئېچىلىدۇ. checkpointLoaderSimple دەپ ئىزدەپ بىر Load Checkpoint كۆزنىكى قۇرۇۋالىمىز.

  • بوش يەرنى ئىككى چېكىپ ئىزدەش ستونىدىن ClipTextEncode قۇرىمىز. كەينىدىنلا يەنە ئوخشاش بىر ClipTextEncode كۆزنىكى ئېچىۋالىمىز. ئاندىن ئىككىلا ClipTextEncode كۆزنىكىنىڭ سول تەرىپىدىكى clip قىسىمىنى checkpointLoaderSimple كۆزنىكىنىڭ ئوڭ تەرىپىدىكى CLIP قىسىمىغا باغلىۋالىمىز. مائۇس بىلەن سۈرسەك سىزىق چىقىدۇ. سۈرۈپ تۇتاشتۇرۇپ قويساق بولىدۇ.

  • ئىزدەش ستونىنى يەنە ئېچىپ KSampler كۆزنىكى ئىزدەپ قۇرۇۋالىمىز. ئاندىن KSampler كۆزنىكىنىڭ سول تەرىپىدىكى model نى تارتىپ checkpointLoaderSimple كۆزنىكىنىڭ ئوڭ تەرىپىدىكى MODEL قىسىمىغا باغلاپ قويىمىز. KSampler نىڭ سول تەرىپىدىكى positive ۋە negative دېگەن ئورۇنلارنى ئايرىم ئايرىم ئالدا ئىككى ClipTextEncode كۆزنىكىنىڭ CONDITIONNING قىسىمىغا باغلاپ بېرىمىز. بۇ دېگەنلىك بۇ ClipTextEncode كۆزنىكىنىڭ positive گە باغلانغىنى بولسا رەسىم ھاسىل قىلغاندا چىقىرىدىغان رەسىمنىڭ تەسۋىرىنى بىلدۈرسە، negative گە باغلانغان ClipTextEncode كۆزنىكى چىقىرىدغان رەسىمدىكى بولماسلىقى كېرەك بولغان تەسۋىرلەرنى بىلدۈرىدۇ. يەنى سىز رەسىمدە «ئىت بولمىسۇن» دېمەكچى بولسىڭىز negative گە باغلانغان ClipTextEncode كۆزنىكىگە «dog» يازسىڭىز بولىدۇ.

  • ئىزدەش سىتونىدىن EmptyLatentImage كۆزنىكى ئىزەپ قۇرىمىز ۋە ئۇنىڭ ئوڭ تەرىپدىكى LATENT قىسىمىنى KSampler نىڭ سول تەرىپىدىكى latent_image قىسىمىغا باغلاپ قويىمىز.

  • ئەمدى يېڭى ئىزدەش سىتونىدىن VaeDecode دەپ ئىزدەپ يېڭى بىر VAE Decode كۆزنىكى قۇرىمىز ۋە ئۇنىڭ سول تەرىپىدىكى samples قىسىمىنى KSampler نىڭ LATENT قىسىمىغا باغلايمىز. VAE Decode كۆزنىكىنىڭ سول تەرىپدىكى vae نى بولسا ئەڭ دەسلەپتە قۇرۋالغان Load Checkpoint كۆزنىكىنىڭ ئوڭ تەرىپىدىكى VAE قىسىمىغا باغلىۋالىمىز.

  • يەنە يېڭى ئىزدەش ستونىدىن SaveImage كۆزنىكى ئىزدەپ قۇرۇۋالىمىز. ئاندىن ئۇنىڭ سول تەرىپىدىكى image قىسىمىنى VAE Decode كۆزنىكىنىڭ ئوڭ تەرىپىدىكى IMAGE قىسىمىغا باغلايمىز.

شۇنداق قىلىپ ئەڭ ئاددىي بولغان بىر خىزمەت شارائىتىنى قۇرۇۋالغان بولدۇق. يۇقارقى باسقۇچلار بۇ رامكىنىڭ نورمال ئشىلىشىدە بەك مۇھىم بولۇپ، مەن بۇلارنى يازغاندا بەكمۇ دىققەت قلىپ يازدىم. شۇنىڭدەك سىزمۇ بەكمۇ دىققەت قلىپ باغلاڭ. ھەرقانداق بىر خاتا باغلىنىش نورمال ئىشلىمەسلىكنى كەلتۈرۈپ چىقىرىدۇ.

ئەمدى رەسىم چىقىرىپ باقساق بولىدۇ. بۇنىڭ ئۈچۈن:

  1. Load Checkpoint دىن بىزنىڭ چۈشۈرۈۋالغان realvisxIV30Turbo… نى تاللاپ بېرىمىز.

  2. KSampler نىڭ ئوڭ تەرىپىدىكى positive غا باغلانغان Clip Text Encoder قىسىمىغا ھاسىل قىلماقچى بولغان رەسىم تەسۋىرىنى يازساق بولىدۇ. بۇ يەرگە پەقەتلا ئېنگىلىزچە يېزىش كېرەك. ئەگەر ئېنگىلىزچىڭىز يەتمىسە، گۇگېل تەرجىماندىن ئۇيغۇرچە يېزىپ ئاندىن ئۇنى ئېنگىلىزچىگە تەرجىمە قىلسىڭىز بولىدۇ. تېخىمۇ تەپسىلىي ئېنگىلىزچە تەسۋىرلەر لازىم بولسا ChatGPT گە ياكى BingChat گە بۇ تەسۋىرنى بېيىتىپ بەر، دەپ يېزىپ ئاندىن Clip Text Encoder قىسىمىغا چاپلىسىڭىزمۇ بولىدۇ.

  3. تور كۆرگۈچنىڭ ئوڭ تەرىپدىكى Queue Prompt نى باسساقلا ھاسىل قىلىشقا باشلايدۇ. كومپيۇتېرنىڭ سەپلىمىسى، تەڭشەكلىرىمىزنىڭ پەرقلىق بولىشىغا قارىتا بۇ ھاسىل قىلىش ۋاقتى خېلىلا پەرقلىق بولىدۇ. بۇ يەردە بىرمۇنچە تەڭشەكلەر بار، ئالدىرىماي ئىزدىنىپ سىناپ باقسىڭىز بولىدۇ. مەسىلەن، Empty Latent Image دىكى رەسىمنىڭ كەڭلىكى width، ئۇزۇنلۇقى height ۋە بىر قېتىمدا قانچە رەسىم batch_size ھاسىل قىلىشقا ئالاقىدار تەڭشەكلەر بولۇپ، KSampler دىكى تەڭشەكلەر بولسا تەكرار سىناپ كۆرگەندىن كېيىن ئاندى بىلىشكە بولىدىغان تەڭشەكلەردۇر.

مېنىڭ ھاسىل قىلغان بەزى رەسىملىرىم تۆۋەندىكىچە:

بۇ رەسىملەرنىڭ ھەممىسى تورسىز شارائىتتا ھاسىل قلىنغان بولۇپ، بەزى كىشىلەرنىڭ ئىسىملىرىنى بىۋاستە يازسىڭىزمۇ ھېچقانداق چەكلىمە بەرمەستىن نورمال تونىۋېرىدۇ. مەسىلەن، يىغلاۋاتقان شىجىنپىڭ، دېگەندەك يازسىڭىزمۇ بولىۋېرىدۇ. ئەمما توردىكى نۇسخىلىرىدا كىشى ئىسىملىرىنى چەكلىۋالىدۇ.

ComfyUI نىڭ يەنە بەشقا ئىقتىدارلىرىمۇ بار. سىز داۋاملىق ئۆگىنىپ ماڭسىڭىز ھەيران قالارلىق مەشغۇلاتلارنى قىلالايسىز. مەسىلەن:

  • يۇقارقى ئاددىي Checkpoint ئىشلىتىشتىن باشقا يەنە LORA ئىشلىتىپ رەسىمنىڭ ئۈنۈمىنى تېخىمۇ يۇقىرى كۆتۈرگىلى بولىدۇ. ComfyUI نىڭ خىزمەت باسقۇچىغا LORA نى قوشۇپ رەسىم سىزدۇرۇش ئاسان بولۇپ، Checkpoint نىڭ ئارقىسىدىنلا ئىشلىتىدىغان قىلىپ توغرىلاپ بەرسەك بولىدۇ. ئەمما ئاۋۋال LORA ھۆججىتىنى چۈشۈرۈشىمىز لازىم. تۆۋەندىكى ئاددىي ئۇسۇل ئارقىلىق سىناپ باقسىڭىز بولىدۇ:

Lora

  • چاپاق رەسىمنى سۈزۈك رەسىمگە ئايلاندۇرۇش ئۈچۈن تۆۋەندىكى ئۇلىنىشتىكى بويىچە Workflow خىزمەت باسقۇچى قۇرسىڭىز بولىدۇ. ئەمما ئېسىڭىزدە بولسۇنكى چوقۇم ESRGAN غا ئوخشاش upscale سۈزۈكلەشتۈرۈش مودېلىنى چۈشۈرۈپ، ئاندىن models/upscale_models دېگەن ئورۇنغا كۆچۈرۈپ ئەكىلىسىز. ئاندىن تۆۋەندىكىدەك باغلنىش قۇرسىڭىزلا بولىدۇ:

Upscale Models

  • قولدا سىزىپ قويغان سەت رەسىمدىن پايدىلىنىپ سۈپەتلىك رەسىم ھاسىل قىلىش ئۈچۈن تۆۋەندىكى ئۇلىنىشتىكى بويىچە خىزمەت باسقۇچى workflow قۇرۇپ سىناپ باقسىڭىز بولىدۇ:

Image to Image

ComfyUI نى ئىشلىتىش جەريانىدا چۈشۈرۈپ سىنىغان chekcpoint ۋە Lora نىڭ چۈشۈرۈش ئادرېسلىرى ۋە قوللانغاندىكى تەڭشەكلىرى تۆۋەندىكىچە:

  1. Checkpoint: realvisxlV30Turbo_v30TurboBakedvae.safetensors
    • Sampler ==> DPM++ SDE Karras
    • Model ==> RealVisXL_V3.0_Turbo
    • Steps ==> 8/6/4
    • CFG ==> 1/2
  2. Checkpoint: zavychromaxl_v31.safetensors
    • Sampler ==> DPM++ 3M SDE Karras / dpmpp_2m_sde_gpu_karras
    • Model ==> zavychromaxl_v31
    • Steps ==> 36/40/30/50/20
    • CFG ==> 3/8.5/5/6/7
  3. Checkpoint: photon_v1.safetensors
    • Control_afrer_generate ==> Randomize
    • sampler_name ==> dpmpp_2m_sde
    • Steps ==> 20
    • CFG ==> 6
    • scheduler ==> karras
    • Latent ==> 720X720
  4. LORA: scared_v2.safetensors
  5. Workflow of ComfyUI: Simple Work Flow
  6. Workflow of ComfyUI: Generate with Upsaceld Image
  7. Workflow of ComfyUI: Upscale Any Image
  8. Workflow of ComfyUI: Generate With LORA
  9. Workflow of ComfyUI: Compare Checkpoints
  10. Workflow of ComfyUI: Image to Image
  11. Workflow of ComfyUI: Image with Mask
  12. Workflow of ComfyUI: Image to Image 2
  13. Workflow of ComfyUI: Hires Fix
  14. Workflow of ComfyUI: Image Upscale 4X
  15. Workflow of ComfyUI: Knight even morning

بۇلاردىن باشقا يەنە رەسىم چىقارغان ۋاقىتتا بېرىلىدىغان بۇيرۇقلار بەكمۇ مۇھىم. شۇڭا قانداق بۇيرۇق بىلەن بىز خالىغان رەسىمنى ھاسىل قىلىدىغانلىقىمىزنى تۆۋەندىكى توربەتتىكى ئۇچۇرلاردىن ناھايىتى چۈشىنىشلىك ھالدا ئۆگىنەلەيمىز:

ھەممىزگە پايدىلىق بىر بىلىم بولىشىنى ئۈمۈد قىلىمەن.