چشم انداز فناوری مدرن بدون شک امسال شاهد هجوم گسترده ای از توجه به دنیای هوش مصنوعی بوده است. با ورود ChatGPT OpenAI، صنعت کلی وارد جریان اصلی شده است. بنابراین، ما یکی از محبوبترین برنامههای تولید تصویر را بررسی میکنیم و چگونگی سریعتر کردن Stable Diffusion را بررسی میکنیم.
Stable Diffusion فوق الذکر الگوریتمی برای تولید تصویر هوش مصنوعی است که به شدت فضا را تحت تاثیر قرار داده است. در واقع، این فناوری دارای مجموعهای از فناوریهاست که روش استفاده از تولید تصویر و هوش مصنوعی را متحول کردهاند. با این حال، مانند تمام فناوریها، از کاستیهای خود مبرا نیست.
یکی از راه های عظیمی که صنعت به دنبال توسعه فناوری هوش مصنوعی است، توسعه سرعت آن است. در واقع، زمان لازم برای ایجاد یک تصویر توسط فناوری میتواند متفاوت باشد، اما اغلب میتواند بسیار گسترده باشد. بنابراین، اگر از کاربران مشتاق Stable Diffusion هستید، افزایش سرعت آن به بخش کلیدی استفاده شما از آن تبدیل شده است.
فقط انتشار پایدار چیست؟
همچنین بخوانید: NFT ها و هوش مصنوعی (AI)
اکنون، قبل از اینکه به چیزهای کلیدی بپردازیم که میتوانید برای سریعتر کردن آن انجام دهید، اجازه دهید ابتدا به بررسی اینکه Stable Diffusion چیست، بپردازیم. به طور خاص، اجازه دهید به سرعت کمی در مورد فناوری و مفید بودن آن توضیح دهیم. علاوه بر این، میتوانیم کمی در مورد اینکه کجا در صنعت بزرگتر هوش مصنوعی شکسته میشود، کاوش کنیم.
اول از همه، Stable Diffusion الگوریتمی است که مبتنی بر هوش مصنوعی است و برای ایجاد تصاویر استفاده می شود. علاوه بر این، الگوریتم خود بخشی از یک پایه گسترده تر است مدل های انتشار. متعاقباً، اینها به دلیل نتایج تماشایی که داده اند، به طور فزاینده ای محبوب شده اند.
جالب توجه است که این مدل از طریق مهندسی معکوس کار می کند، زیرا فرآیند را با یک تصویر تیره آغاز می کند که به آرامی بر اساس دستور ورودی اصلاح می شود. اگرچه می تواند منجر به نتایج خیره کننده و چشمگیر شود، اما نسبتاً زمان بر است.
بنابراین، بیایید کمی در مورد روند ساخت سریعتر Stable Diffusion بررسی کنیم.
چگونه انتشار پایدار را سریعتر کنیم
همچنین بخوانید: OpenAI ثبت نام های جدید ChatGPT Plus را به دلیل افزایش تقاضا متوقف می کند
اگرچه میل به سریعتر کردن الگوریتم مطمئناً در همه مواردی که از Stable Difussion استفاده می کنند رایج است، پاسخ دادن به آن به آسانی نیست. با این حال، سه راه اصلی وجود دارد که می توانید در مورد سرعت بخشیدن به خروجی الگوریتم و تلاش برای کاهش بخشی از زمان لازم برای ایجاد یک تصویر استفاده کنید.
بهینه سازی توجه متقابل
اولین راه برای سرعت بخشیدن به انتشار پایدار از طریق فرآیندی به نام بهینه سازی توجه متقابل است. ثابت شده است که این یکی از موفق ترین راه های افزایش سرعت برنامه در حال حاضر است. علاوه بر این، برای سرعت بخشیدن به محاسبه متقاطع الگوریتم و نیاز به حافظه بسیار کمتری اجرا شده است.
با این حال، بهترین روش بهینهسازی توجه متقاطع تا حد زیادی به نرمافزاری که از Stable Diffusion استفاده میکنید بستگی دارد. برای این مثال، ما به AUTOMATIC1111 Stable Diffusion GUI می پردازیم تا به بهترین شکل بررسی کنیم که این فرآیند چگونه کار می کند.
برای AUTOMATIC111، می خواهید صفحه تنظیمات را پیدا کنید. از آنجا روی تب Optimization کلیک می کنید. سپس، به ویژگی Cross Attention Optimization که باید یک منوی کشویی را نشان دهد، بروید. پس از آن، یک گزینه بهینه سازی را از پیش تنظیم خودکار که برای شما انتخاب کرده است، انتخاب خواهید کرد. هنگامی که دقیق ترین گزینه را انتخاب کردید، سپس می توانید اعمال تنظیمات را انتخاب کنید.
علاوه بر این، تعداد زیادی تکنیک برای بهینه سازی توجه متقابل وجود دارد. از جمله مواردی مانند Doggettx، xFormers، توجه Sub-quadratic و موارد دیگر هستند. همه اینها برای سرعت بخشیدن به فرآیند به طور کلی کار می کنند، با تمرکز ویژه بر بهینه سازی متقابل.
ادغام توکن
راه دیگری برای سرعت بخشیدن به انتشار پایدار، از طریق تکنیکی به نام ادغام توکن است. به طور خاص، این فرآیندی است که در آن شما سرعت الگوریتم را با کاهش تعداد توکنهایی که توسط آن پردازش میشوند، افزایش میدهید. علاوه بر این، نشانه هایی را شناسایی می کند که ممکن است غیرضروری یا زائد باشند تا خروجی سریعتر اتفاق بیفتد.
چیزی که در مورد AUTOMATIC1111 عالی است این است که از پشتیبانی ادغام توکن داخلی استفاده می کند. برای دسترسی به این، فقط باید یک بار دیگر به صفحه تنظیمات بروید. سپس، به Optimizations بروید و نسبت Token Merging را تغییر دهید.
به عنوان مثال، 0.2 به این معنی است که 20٪ از توکن ها را ادغام می کند. پس از آن، هنگامی که به مبلغ مورد نظر خود رسیدید، تب Apply Settings را انتخاب کنید. این باید کمک زیادی به انتشار پایدار شما کند تا نتایج بسیار سریعتری تولید کند و دسترسی به آن نسبتاً آسان است.
راهنمای منفی حداقل سیگما
سومین و آخرین راه که ما به بررسی سریعتر انتشار پایدار می پردازیم، از طریق سیگمای هدایت منفی است. این گزینه روش دیگری برای سرعت بخشیدن به روند تولید تصویر با خاموش کردن پیام منفی است که در شرایط مختلفی که به نظر شما تأثیری بر نتیجه ندارد، ارائه می شود.
برای انجام این کار، باید به صفحه تنظیمات برنامه بروید. از آنجا، یک بار دیگر تب بهینه سازی را پیدا خواهید کرد. سپس مقدار سیگما حداقل راهنمایی منفی را تعیین می کنید. وقتی به مقدار بهینه رسیدید، میتوانید اعمال تنظیمات را انتخاب کنید.
گزینه های دیگری برای بهینه سازی سرعت Stable Diffusion وجود دارد. از جمله مواردی مانند بهینه سازی PyTorch یا استنتاج DeepSpeed. با این حال، این سه ایده باید به شما پایه خوبی برای شروع بهترین استفاده از الگوریتم و سرعت بخشیدن به خروجی آن به طور قابل توجهی بدهد.