طی سال گذشته، صعود فناوری هوش مصنوعی به جریان اصلی یک پیشرفت حیاتی بوده است. در میان افزایش شهاب سنگی از ChatGPT OpenAI، بسیاری از صنایع از این الگوریتم های مولد هوش مصنوعی به عنوان ابزار مفید استفاده کرده اند. با این حال، بسیاری از این ابزارها با منحنی یادگیری نسبتاً شیب دار عرضه می شوند. در این راهنما، مقیاس CFG در انتشار پایدار چیست.
در واقع، انتشار پایدار به یکی از محبوب ترین ابزارهای تولید تصویر در صنعت تبدیل شده است. خروجی چشمگیر این الگوریتم باعث شده است تا به یکی از برنامه های تولید تصویر تبدیل شود. با این حال، هنوز مجموعه وسیعی از جنبهها را حفظ میکند که تسلط بر آنها مدتی طول میکشد.
چیزهای زیادی وجود دارد که می تواند نتایج را در هنگام استفاده از Stable Diffusion به طور گسترده بهبود بخشد یا مانع شود. پس از آن، مهم است که بدانید آنها چیست و چگونه از آنها برای بهبود الگوریتم برای موارد استفاده خاص خود استفاده کنید. اکنون، این راهنما به بررسی این موضوع میپردازد که مقیاس CFG چیست و چرا اینقدر مهم است.
مقیاس CFG چیست؟
همچنین بخوانید: آیا در اعلان های انتشار پایدار به کاما نیاز دارید؟
اکنون، قبل از اینکه به تأثیر برنامه بپردازیم، بیایید بررسی کنیم که مقیاس CFG چیست. در Stable Diffusion، این سه حرف نشان دهنده مقیاس Classifier Free Guidance هستند. به طور خاص، این تنظیمی را نشان میدهد که نشاندهنده این است که Stable Diffusion تا چه حد از دستور متن شما در هنگام تولید یک تصویر پیروی میکند.
این مقیاس در هر دو نسل متن به تصویر (txt2img) و تصویر به تصویر (img2img) برای الگوریتم اعمال می شود. علاوه بر این، هرچه مقدار CFGH بالاتر باشد، الگوریتم با دقت بیشتری به دستور متن وارد شده میچسبد.
از طرف دیگر، هرچه مقدار کمتر باشد، سیستم آزادی بیشتری در تولید تصویر خواهد داشت. مقدار پیشفرض مقیاس CFG 7 است که نقطه شروع خوبی است و تعادلی را در آزادی سیستم و اطاعت از دستورالعملهای داده شده نشان میدهد.
WebUI سیستم فقط به اعداد مثبت اجازه می دهد که 1 کمترین مقدار ممکن است. علاوه بر این، حداکثر ورودی 30 را می دهد. این ارقام نرده های محافظ خوبی را برای مقیاس ارائه می دهند، اگرچه استثناهایی با تکرارهای مختلف برنامه امکان پذیر است.
چگونه بر انتشار پایدار تأثیر می گذارد
همچنین بخوانید: چگونه انتشار پایدار را آموزش دهیم؟
اکنون که می دانیم مقیاس CFG چیست، بیایید بررسی کنیم که چگونه بر انتشار پایدار تأثیر می گذارد. اگرچه مقیاس به خودی خود تعیین می کند که سیستم چقدر از دستورالعمل های متنی شما پیروی می کند، اما به این سادگی نیست. مقدار CFG ورودی با عوارض جانبی متفاوتی همراه خواهد بود، و مواردی مانند روش نمونه برداری اویلر A این تفاوت ها را نشان می دهد.
به طور خاص، در مثال از الگوریتم روزی روزگاریافزایش CFG منجر به افزایش اشباع رنگ می شود. علاوه بر این، منجر به افزایش کنتراست و تصاویر تار می شود که جزئیات بسیار کمتری تولید می کند.
اگر با این موارد مشکل دارید، مهم است که بین تولید تصویر تعادل ایجاد کنید. به طور خاص، می توانید کارهایی مانند افزایش مراحل نمونه برداری یا تغییر روش های نمونه برداری انجام دهید. با این حال، مهم است که به یاد داشته باشید که به طور مداوم اثرات مقیاس CFG را آزمایش کنید. در نهایت، آزمون و خطا بهترین راه برای به دست آوردن نتایج بهینه برای خروجی مورد نظر شما است.