मैं आपको AI चित्र Webui (स्थिर अंतर) के बारे में बताऊंगा
आज मैं आपको उस साइट का मार्गदर्शन करूंगा जो एआई के साथ मुफ्त में तस्वीर खींचती है!
आप वास्तव में आसानी से एक तस्वीर खींच सकते हैं!
वेबुई (स्थिर अंतर)
22 अगस्त, 2022 को जारी स्थिरता एआई, एक एआई मॉडल है जो पाठ को एक छवि में परिवर्तित करता है। इस मॉडल को एक ओपन सोर्स लाइसेंस के रूप में वितरित किया जाता है, जिससे विभिन्न प्रकार के उपयोगकर्ता इसे स्वतंत्र रूप से उपयोग करने की अनुमति देते हैं। जब आप पाठ में प्रवेश करते हैं, तो स्थिरता एआई उस पाठ के आधार पर एक उच्च गुणवत्ता वाली छवि बनाता है।
वेबसाइट का पता :
https://stability.ai/
विशेषता:
स्टेबल डिफ्यूजन, म्यूनिख, जर्मनी में म्यूनिख विश्वविद्यालय में मशीन विजन एंड लर्निंग ग्रुप (COMPVIS) लैब द्वारा "हाई रिज़ॉल्यूशन इमेज सिंथेसिस रिसर्च" के आधार पर विकसित एक गहरी लर्निंग आर्टिफिशियल इंटेलिजेंस मॉडल है। इसे स्थिरता एआई और रनवे एमएल के समर्थन के साथ विकसित किया गया है।
स्टेबिलिटी एआई एक ब्रिटिश कंपनी है जिसे इमाद मोस्टके कहा जाता है, जो स्थिर अंतर के लिए कंप्यूटिंग संसाधन प्रदान करता है, जिससे आप एक LAION-5B डेटाबेस सीख सकते हैं। डल-ई 2 या इमेजेन जैसे टेक्स्ट-टू-इमेज मॉडल के विपरीत, इस मॉडल का उपयोग कंप्यूटर पर 4 जीबी या उससे कम के वीआरएएम के साथ कंप्यूटर संसाधनों को कम करके भी किया जा सकता है।
इसके अलावा, भले ही यह महंगा हो, यह खुले स्रोत के लिए खुला है और इसका उपयोग आम जनता द्वारा किया जा सकता है। इसने एआई को पेंटिंग की उम्र खोली है, और मॉडल के आधार पर एआई छवि सेवा फ़ंक्शन में वृद्धि जारी है।
आप एक मुद्रा बनाने के लिए प्लग -इन "कंट्रोलनेट" का उपयोग कर सकते हैं। इसके अलावा, विभिन्न ControlNet Auxiliary मॉडल का उपयोग करके, जैसे कि OpenPos से प्राप्त कैनी मॉडल, यह लाइन स्तर के स्केच में मदद करने के लिए शरीर के क्षेत्र की फसलों को समायोजित करता है।
स्थिर अंतर मुख्य रूप से तीन कृत्रिम तंत्रिका नेटवर्क से बना है: क्लिप, यूएनईटी, और वीएई (वीएई)। जब उपयोगकर्ता पाठ में प्रवेश करता है, तो पाठ एनकोडर, क्लिप, पाठ को उस टोकन में परिवर्तित करता है जिसे UNET समझ सकता है। UNET टोकन के आधार पर बेतरतीब ढंग से उत्पन्न शोर को हटाकर एक छवि बनाता है। डिनोइजिंग प्रक्रिया को दोहराने से एक सटीक छवि बनती है, और वीएई इन छवियों को पिक्सेल में परिवर्तित करने में एक भूमिका निभाता है।
पारंपरिक प्रसार संभाव्यता छवि निर्माण मॉडल के विपरीत, स्थिर अंतर ने ओटो इनकोडर को पहले और बाद में इस समस्या को हल करने के लिए पेश किया है कि रिज़ॉल्यूशन बढ़ने के साथ संसाधन की खपत बढ़ जाती है। यह आपको संभावित स्थान के एक छोटे स्तर में शोर में हेरफेर करके एक अपेक्षाकृत बड़ी रिज़ॉल्यूशन छवि बनाने की अनुमति देता है, न कि पूरी छवि, और कई कंप्यूटिंग संसाधनों की आवश्यकता नहीं है। इसलिए, स्थिर अंतर का उपयोग सामान्य मान्यताओं में उपयोग किए जाने वाले ग्राफिक्स कार्ड के संसाधन के रूप में किया जा सकता है।
लाइसेंस:
स्टेबल एआई ने नई मशीन लर्निंग के लिए एक ओपन सोर्स लाइसेंस [4] पेश किया। इस लाइसेंस में सामान्य ओपन सोर्स लाइसेंस से एक अलग सुविधा है। यदि आप स्थिर अंतर का उपयोग करके एक सेवा प्रदान करते हैं, तो उपयोगकर्ता को स्पष्ट रूप से उस लाइसेंस का पालन करना चाहिए। इसके अलावा, जब पिनिंग मॉडल को ट्यूनिंग करते हैं, तो इसका उपयोग केवल लाइसेंस में निर्दिष्ट विशिष्ट उपयोग के लिए किया जाना चाहिए, और अन्य उद्देश्यों के लिए उपयोग नहीं किया जाना चाहिए।
का उपयोग कैसे करें :
स्थिर अंतर का उपयोग करके विभिन्न खुले स्रोत परियोजनाओं को विकसित किया गया है। नीचे प्रत्येक परियोजना का विवरण दिया गया है:
1. स्थिर डिफनेस वेब यूआई: एक परियोजना जो स्थिर प्रसार मॉडल का उपयोग करना आसान बनाने के लिए एक वेब -आधारित उपयोगकर्ता इंटरफ़ेस प्रदान करती है। डेवलपर्स स्थिर प्रसार के फ्रंट एंड फ़ंक्शन के अलावा GFPGAN सुधार, ESRGAN UPSCALING और टेक्स्ट इनवर्जन जैसी कई प्रकार की सुविधाओं को अपडेट और जोड़ना जारी रखते हैं।
2. मूल लेखक: कॉम्पविस द्वारा प्रकाशित मूल परियोजना। प्रयोज्य सीमित है, इसलिए इसका उपयोग संदर्भ उद्देश्यों के लिए किया जा सकता है।
3. डिफ्यूज़र: यह एक प्रसिद्ध मशीन लर्निंग फ्रेमवर्क प्रदाता हेरिंग फेस द्वारा प्रदान किए गए नए प्रसार मॉडल के लिए एक फ्रेम है। यह आसानी से स्थिर प्रसार के फ़ाइनटुनेंग को आसानी से बनाने का एक तरीका प्रदान करता है। इसमें ट्रांसफॉर्मर या डेटासेट जैसे फ्रेमवर्क भी शामिल हैं।
4. डिफनेसबी: आप मैक के लिए ऐप के साथ सीधे स्थिर अंतर चला सकते हैं। पाठ और छवियों को दर्ज करना संभव है, और साथ -साथ और आउटपोस्टिंग फ़ंक्शंस का समर्थन भी करता है। Apple सिलिकॉन संस्करण Apple सिलिकॉन के अंदर एक तंत्रिका इंजन का उपयोग करता है, और मुख्यालय संस्करण गुणवत्ता बढ़ाने के लिए GPU का उपयोग करता है, लेकिन गति धीमी है। यह इंटेल मैक का भी समर्थन करता है और भविष्य में विंडोज का समर्थन करेगा।
5. चीजें ड्रा करें: आप iOS, iPados और MacOS के लिए ऐप्स के साथ स्थिर अंतर चला सकते हैं। यह तीन मोड का समर्थन करता है: सीपीयू + जीपीयू, सीपीयू + तंत्रिका इंजन, सीपीयू + जीपीयू + तंत्रिका इंजन (सभी)। आप चेकपॉइंट, लोरा, टेक्स्ट इनवर्जन, आदि का उपयोग कर सकते हैं, और Webui को एक समान सुविधा प्रदान करते हैं। विस्तार फ़ंक्शन समर्थित नहीं है, और मेमोरी क्षमता की कमी के कारण, ऐप अक्सर मेमोरी की कमी के कारण समाप्त हो सकता है यदि यह पुराने और नए दोनों उपकरणों में एक निश्चित रिज़ॉल्यूशन से अधिक चलता है।
6. रिफ़्यूजन: यह स्पेक्ट्रोग्राम का उपयोग करके इसे रचना एआई में लागू करने का एक उदाहरण है।
7. डिश इनसाइड एआई इमेज गैलरी: हमने एक समर्पित गैलरी खोली है जो सिविटई की सेवा का उपयोग करके एआई छवियां बना सकती है।
उपरोक्त परियोजनाएं विभिन्न कार्यों और वातावरणों में AI छवियों को बनाने के लिए स्थिर प्रसार का उपयोग करती हैं।
टिप्पणियाँ
एक टिप्पणी भेजें