5টি সেরা ওপেন-সোর্স এআই ইমেজ জেনারেটর

5টি সেরা ওপেন-সোর্স এআই ইমেজ জেনারেটর

দ্রুত লিঙ্ক

এআই-ভিত্তিক টেক্সট-টু-ইমেজ জেনারেশন মডেলগুলি সর্বত্র রয়েছে এবং প্রতিদিন অ্যাক্সেস করা সহজ হয়ে উঠছে। যদিও একটি ওয়েবসাইট পরিদর্শন করা এবং আপনি যে চিত্রটি খুঁজছেন সেটি তৈরি করা সহজ হলেও, ওপেন-সোর্স টেক্সট-টু-ইমেজ জেনারেটর আপনার সেরা বাজি যদি আপনি প্রজন্মের প্রক্রিয়াটির উপর আরও নিয়ন্ত্রণ চান।





দিনের মেকইউজের ভিডিও কন্টেন্টের সাথে চালিয়ে যেতে স্ক্রোল করুন

ইন্টারনেটে কয়েক ডজন ফ্রি এবং ওপেন-সোর্স এআই টেক্সট-টু-ইমেজ জেনারেটর উপলব্ধ রয়েছে যা নির্দিষ্ট ধরণের ছবিতে বিশেষজ্ঞ। সুতরাং, আমরা স্তূপটি খুঁজে বের করেছি এবং সেরা ওপেন-সোর্স AI টেক্সট-টু-ইমেজ জেনারেটর খুঁজে পেয়েছি যা আপনি এখনই চেষ্টা করতে পারেন।





1 ক্রেয়ন

  craiyon-হোম-পৃষ্ঠা

Craiyon হল সবচেয়ে সহজে অ্যাক্সেসযোগ্য ওপেন সোর্স এআই ইমেজ জেনারেটরগুলির মধ্যে একটি। এটি DALL-E Mini-এর উপর ভিত্তি করে এবং যখন আপনি ক্লোন করতে পারেন Github সংগ্রহস্থল এবং আপনার কম্পিউটারে স্থানীয়ভাবে মডেলটি ইনস্টল করুন, Craiyon তার ওয়েবসাইটের পক্ষে এই পদ্ধতিটি বাদ দিয়েছে বলে মনে হচ্ছে।





অফিসিয়াল Github সংগ্রহস্থলটি জুন 2022 থেকে আপডেট করা হয়নি, তবে সর্বশেষ মডেলটি এখনও বিনামূল্যে পাওয়া যাচ্ছে অফিসিয়াল Craiyon সাইট . কোন Android বা iOS অ্যাপ্লিকেশন নেই.

কার্যকারিতার পরিপ্রেক্ষিতে, আপনি একটি এআই ইমেজ জেনারেটর থেকে আশা করা সমস্ত সাধারণ বিকল্পগুলি দেখতে পাবেন। একবার আপনি আপনার প্রম্পট প্রবেশ করান এবং একটি চিত্র পান, আপনি উচ্চ-রেজোলিউশন কপি পেতে আপস্কেল বৈশিষ্ট্যটি ব্যবহার করতে পারেন। বেছে নেওয়ার জন্য তিনটি শৈলী রয়েছে: শিল্প, ফটো এবং অঙ্কন। আপনি যদি মডেলটি সিদ্ধান্ত নিতে চান তবে আপনি 'কোনও নয়' বিকল্পটি নির্বাচন করতে পারেন।



  craiyon-উত্পন্ন-ইমেজ

অতিরিক্তভাবে, 'বিশেষজ্ঞ মোড' আপনাকে নেতিবাচক শব্দগুলি অন্তর্ভুক্ত করতে দেয়, যা মডেলটিকে নির্দিষ্ট আইটেমগুলি এড়াতে বলে৷ এছাড়াও একটি প্রম্পট ভবিষ্যদ্বাণী বৈশিষ্ট্য রয়েছে, যা ChatGPT ব্যবহার করে ব্যবহারকারীদের সর্বোত্তম, সবচেয়ে বিস্তারিত প্রম্পট লিখতে সাহায্য করে। সবশেষে, এআই-চালিত রিমুভ ব্যাকগ্রাউন্ড ফিচার আপনাকে ছবি থেকে ব্যাকগ্রাউন্ড কাটানোর সময় এবং প্রচেষ্টা বাঁচাতে সাহায্য করতে পারে।

এবং যে Craiyon সবকিছু সম্পর্কে. এটি সবচেয়ে পরিশীলিত এআই ইমেজ জেনারেশন মডেল নয়, তবে আপনি যদি বিস্তারিত বা বাস্তবসম্মত কিছু না চান তবে এটি একটি মৌলিক মডেল হিসাবে ভাল কাজ করে।





মডেলটি ব্যবহার করার জন্য বিনামূল্যে, তবে বিনামূল্যে ব্যবহারকারীরা এক মিনিটের মধ্যে একবারে নয়টি বিনামূল্যের ছবিতে সীমাবদ্ধ। আপনি তাদের সমর্থক বা পেশাদার স্তরে সদস্যতা নিতে পারেন (মূল্য যথাক্রমে এবং প্রতি মাসে, এবং বার্ষিক বিল করা হয়) যাতে কোনও বিজ্ঞাপন বা জলছাপ না পাওয়া যায়, দ্রুত প্রজন্ম, এবং আপনার তৈরি করা ছবিগুলিকে ব্যক্তিগত রাখার বিকল্প। একটি কাস্টম সাবস্ক্রিপশন স্তর এছাড়াও কাস্টম মডেল, ইন্টিগ্রেশন, ডেডিকেটেড সমর্থন, এবং ব্যক্তিগত সার্ভারের অনুমতি দেয়।

2 স্থিতিশীল বিস্তার 1.5

স্টেবল ডিফিউশন সম্ভবত সবচেয়ে জনপ্রিয় ওপেন সোর্স টেক্সট-টু-ইমেজ জেনারেশন মডেলগুলির মধ্যে একটি। এটি নীচে উল্লিখিত তিনটি ইমেজ জেনারেটর সহ অন্যান্য মডেলগুলিকেও শক্তি দেয়৷ এটি 2022 সালে প্রকাশিত হয়েছিল এবং তখন থেকে অনেকগুলি বাস্তবায়ন হয়েছে।





কিভাবে নতুন আপেল টিভি রিমোট পেয়ার করতে হয়
  stable-diffusion-web-ui

মডেল কীভাবে কাজ করে তার অত্যধিক প্রযুক্তিগত বিশদ আমি আপনাকে ছাড় দেব (যার জন্য আপনি তাদের পরীক্ষা করতে পারেন অফিসিয়াল Github সংগ্রহস্থল ), তবে মডেলটি সম্পূর্ণ নতুনদের জন্যও ইনস্টল করা সহজ এবং যতক্ষণ না আপনার কাছে কমপক্ষে 4GB মেমরি সহ একটি ডেডিকেটেড GPU থাকে ততক্ষণ পর্যন্ত এটি ভাল কাজ করে৷ আপনি অ্যাক্সেস করতে পারেন স্থিতিশীল বিস্তার অনলাইন, এবং আপনি চাইলে আমরা আপনাকে কভার করেছি একটি Mac এ স্থিতিশীল বিস্তার চালান .

স্ট্যাবল ডিফিউশনের জন্য ব্যবহার করার জন্য বেশ কয়েকটি চেকপয়েন্ট রয়েছে (এগুলির সংস্করণ বিবেচনা করুন)। আমরা সংস্করণ 1.5 পরীক্ষা করার সময়, সংস্করণ 2.1 এছাড়াও সক্রিয় উন্নয়ন এবং আরো সুনির্দিষ্ট.

  dreamshaper-ai-উত্পন্ন-ইমেজ
ইয়াদুল্লাহ আবিদি/মেকইউজঅফ/ড্রিমশেপার

মডেল চালানো এছাড়াও বরং সহজ. আমরা এটি দিয়ে পরীক্ষা করেছি স্বয়ংক্রিয় 1111 স্থিতিশীল বিস্তার ওয়েব ব্যবহারকারী ইন্টারফেস , এবং সমস্ত নিয়ন্ত্রণ এবং পরামিতি ভাল কাজ করে। এটি LAION-5B ডাটাবেসের সৌজন্যেও বেশ NSFW-প্রমাণ যা মডেলটি প্রশিক্ষণ দিয়েছে (যদিও এটি নিখুঁত নয়, মনে রাখবেন)। যদিও প্রজন্মের সময় নিজেই আপনার হার্ডওয়্যারের উপর ভিত্তি করে পরিবর্তিত হবে, আপনি আশা করতে পারেন যে আপনার ছবিগুলি বিশদ এবং বাস্তবসম্মত হবে এমনকি মৌলিক প্রম্পট সহ।

ঘুমের পর নীল পর্দা উইন্ডোজ ১০

3 ড্রিমশেপার

ড্রিমশেপার একটি ইমেজ জেনারেশন মডেল যা স্টেবল ডিফিউশনের উপর ভিত্তি করে। এটি মিডজার্নির একটি ওপেন-সোর্স বিকল্প হিসাবে তৈরি করা হয়েছিল এবং জেনারেট করা চিত্রগুলিতে ফটোরিয়েলিজমের উপর ফোকাস করে, যদিও এটি অ্যানিমে এবং পেইন্টিং শৈলীগুলিকে কয়েকটি পরিবর্তনের সাথে পরিচালনা করতে পারে।

মডেলটি স্ট্যাবল ডিফিউশনের চেয়ে বেশি সক্ষম, যা ব্যবহারকারীদের চূড়ান্ত আউটপুটে আরও স্বাধীনতা দেয়, বজ্রপাতের উন্নতি থেকে শুরু করে শিথিল NSFW সীমাবদ্ধতা পর্যন্ত। মডেল চালানো এছাড়াও সহজ, একটি সঙ্গে ডাউনলোডযোগ্য, প্রাক-প্রশিক্ষিত সংস্করণ উপলব্ধ স্থানীয় অ্যাক্সেস এবং ওয়েবসাইটগুলির হোস্টের জন্য অনলাইন, সহ সিনকিন.আই , এলোমেলো বীজ , এবং ম্যাজ.স্পেস (একটি মৌলিক সাবস্ক্রিপশন প্রয়োজন) যা আপনাকে GPU ত্বরণ সহ মডেলটি চালাতে দেয়।

  dreamshaper-stablediffusion-তুলনা

আপনি সম্ভবত এখনই অনুমান করতে পারেন, ড্রিমশেপার দ্বারা উত্পন্ন চিত্রগুলি স্ট্যাবল ডিফিউশনের তুলনায় আরও বাস্তবসম্মত দেখায়। এমনকি যদি আপনি উভয় মডেলে একই প্রম্পট চালান, ড্রিমশেপার মডেলটি সম্ভবত আরও বাস্তবসম্মত, বিস্তারিত এবং আরও ভাল আলোকিত হবে।

এটি প্রতিকৃতি বা চরিত্রগুলির জন্য বিশেষভাবে সত্য, এমন কিছু যা আমি একই প্রম্পটের তুলনায় স্থিতিশীল বিস্তারের অভাব খুঁজে পেয়েছি। যদি আপনার ছবিগুলি খুব বাস্তবসম্মত হয়ে ওঠে, এখানে আছে একটি AI-উত্পন্ন চিত্র সনাক্ত করার চারটি উপায় .

মডেলটি চালানোর জন্য আপনার একটি বেহেমথ পিসি দরকার নেই। আমার GTX 1650Ti 4GB VRAM সহ মডেলটি পুরোপুরি চালায়। জেনারেশন সময় একটু বেশি ছিল, কিন্তু এটি প্রকৃত আউটপুটকে প্রভাবিত করে বলে মনে হয় না। তাতে বলা হয়েছে, ড্রিমশেপার এক্সএল চালানোর জন্য আপনার আরও ভিআরএএম সহ জিপিইউর প্রয়োজন হতে পারে, যা স্ট্যাবল ডিফিউশন এক্সএল মডেলের উপর ভিত্তি করে।

4 InvokeAI

Invoke AI হল আরেকটি AI-ভিত্তিক ইমেজ জেনারেশন মডেল যা স্টেবল ডিফিউশনের উপর ভিত্তি করে, যার একটি XL সংস্করণ স্টেবল ডিফিউশন XL-এর উপর ভিত্তি করে। এটির নিজস্ব ওয়েব এবং কমান্ড লাইন ইউজার ইন্টারফেসও রয়েছে, যার অর্থ আপনাকে স্ট্যাবল ডিফিউশন ওয়েব UI এর মতো জিনিসগুলির সাথে হুপস করতে হবে না।

  invokeai-ব্যবহারকারী-ইন্টারফেস-সহ-ইমেজ

মডেলটি ব্যবহারকারীদের কাস্টমাইজড ওয়ার্কফ্লো সহ তাদের বৌদ্ধিক সম্পত্তির উপর ভিত্তি করে ভিজ্যুয়াল তৈরি করতে দেওয়ার উপর দৃষ্টি নিবদ্ধ করে। InvokeAI হল অন্যতম সেরা ওপেন সোর্স এআই ইমেজ জেনারেশন মডেলগুলির মধ্যে একটি যা কাস্টম মডেলের প্রশিক্ষণ এবং মেধা সম্পত্তি নিয়ে কাজ করার জন্য।

আপনি কি ম্যাকের ফোল্ডারের রঙ পরিবর্তন করতে পারেন?

এর অফিসিয়াল Github সংগ্রহস্থল দুটি ইনস্টলেশন পদ্ধতি তালিকাভুক্ত করে: InvokeAI এর ইনস্টলারের মাধ্যমে ইনস্টল করা বা PyPI ব্যবহার করে যদি আপনি টার্মিনাল এবং পাইথনের সাথে স্বাচ্ছন্দ্যবোধ করেন এবং মডেলের সাথে ইনস্টল করা প্যাকেজগুলির উপর আরও নিয়ন্ত্রণের প্রয়োজন হয়।

যাইহোক, অতিরিক্ত নিয়ন্ত্রণ কিছু সীমাবদ্ধতা নিয়ে আসে, বিশেষ করে কঠোর হার্ডওয়্যার প্রয়োজনীয়তা। InvokeAI কমপক্ষে 4GB মেমরি সহ একটি ডেডিকেটেড GPU সুপারিশ করে, XL ভেরিয়েন্ট চালানোর জন্য সুপারিশকৃত ছয় থেকে আট GB। VRAM এর প্রয়োজনীয়তাগুলি AMD এবং Nvidia GPU উভয়ের ক্ষেত্রেই প্রযোজ্য। মডেল, এর নির্ভরতা এবং পাইথনের জন্য আপনার কমপক্ষে 12GB RAM এবং 12GB ফ্রি ডিস্ক স্পেসও প্রয়োজন।

  ইনভোক-এআই-জেনারেটেড-ইমেজ
ইয়াদুল্লাহ আবিদি/মেকইউজঅফ/ইনভোকএআই

যদিও ডকুমেন্টেশন এনভিডিয়ার জিটিএক্স 10 সিরিজ এবং 16 সিরিজের জিপিইউগুলির ভিডিও মেমরির অভাবের জন্য সুপারিশ করে না, প্রদত্ত ইনস্টলারটি ঠিকঠাকভাবে চলেছিল। যদিও আপনার মাইলেজ পরিবর্তিত হতে পারে, আপনি যদি একটি নিম্ন-প্রান্তের GPU তে থাকেন, তাহলে আপনার প্রম্পটগুলিকে ছবিতে রূপান্তরিত করার জন্য আরও অপেক্ষা করার আশা করুন৷ অবশেষে, আপনি যদি উইন্ডোজে থাকেন তবে আপনি শুধুমাত্র একটি এনভিডিয়া জিপিইউ ব্যবহার করতে পারেন, কারণ বর্তমানে এএমডি জিপিইউগুলির জন্য কোনও সমর্থন নেই।

ইমেজ জেনারেশন অংশের জন্য, মডেলটি ফটোরিয়ালিজমের চেয়ে শৈল্পিক শৈলীর দিকে বেশি ঝুঁকে থাকে। অবশ্যই, আপনি আপনার ডেটাসেটে মডেলটিকে প্রশিক্ষণ দিতে পারেন এবং এটিকে আপনি যা চান তার কাছাকাছি চিত্র তৈরি করতে পারেন, এমনকি যদি এতে ফটোরিয়ালিস্টিক ছবি জড়িত থাকে, বিশেষ করে যদি আপনি পণ্যের নকশা, আর্কিটেকচার বা খুচরা জায়গায় কাজ করেন। যাইহোক, মনে রাখা একটি গুরুত্বপূর্ণ বিষয় হল যে InvokeAI প্রাথমিকভাবে একটি ইমেজ জেনারেশন ইঞ্জিন, যার অর্থ আপনাকে সম্ভবত সেরা ফলাফলের জন্য আপনার নিজের মডেলগুলি ব্যবহার করতে হবে (ওয়েব ইন্টারফেসে প্রদত্ত মডেল ম্যানেজারের মাধ্যমে সহজেই পাওয়া যায়) ডিফল্ট হিসাবে। মডেল স্থিতিশীল বিস্তার নিজেই অনুরূপ.

5 খোলা যাত্রা

ওপেনজার্নি হল একটি ফ্রি, ওপেন সোর্স এআই ইমেজ জেনারেশন মডেল যা আবার স্টেবল ডিফিউশনের উপর ভিত্তি করে। আপনি যদি ভাবছেন কেন মডেলটিকে ওপেনজার্নি বলা হয়, কারণ এটি মিডজার্নি চিত্রগুলিতে প্রশিক্ষিত ছিল এবং এটি তৈরি করা চিত্রগুলিতে এর শৈলী অনুকরণ করতে পারে।

প্রম্পটহিরো , ওপেনজার্নির পিছনের কোম্পানি, আপনাকে স্ট্যাবল ডিফিউশন (সংস্করণ 1.5 এবং 2), ড্রিমশেপার এবং বাস্তবসম্মত দৃষ্টি সহ অন্যান্য মডেলের পাশাপাশি মডেলটি পরীক্ষা করতে দেয়। সাইন আপ করার সময়, আপনি 25টি বিনামূল্যে ক্রেডিট পাবেন (প্রতিটি ছবির জন্য একটি ক্রেডিট তৈরি করা হয়েছে), তারপরে আপনাকে তাদের প্রো সাবস্ক্রিপশন স্তরে সদস্যতা নিতে হবে, যার দাম প্রতি মাসে এবং আপনাকে অন্যান্য একচেটিয়া বৈশিষ্ট্য সহ প্রতি মাসে 300টি ক্রেডিট অ্যাক্সেস দেয়৷

  openjourney-stablediffusion-তুলনা

তবে, আপনি যদি এটি স্থানীয়ভাবে এবং বিনামূল্যে চালাতে চান তবে আপনি করতে পারেন HuggingFace থেকে মডেল ফাইল ডাউনলোড করুন এবং স্থিতিশীল ডিফিউশন ওয়েব UI ব্যবহার করে এটি চালান। ওপেনজার্নি হল হাগিংফেসে দ্বিতীয় সর্বাধিক ডাউনলোড করা এআই ইমেজ জেনারেশন মডেল, স্থিতিশীল ডিফিউশনের ঠিক পিছনে।

ওপেনজার্নি তার ওয়েবসাইটে স্থানীয়ভাবে মডেল চালানোর জন্য কোনো নির্দিষ্ট হার্ডওয়্যার প্রয়োজনীয়তা তালিকাভুক্ত করে না, তবে আপনি স্থিতিশীল বিস্তারের জন্য অনুরূপ হার্ডওয়্যার প্রয়োজনীয়তা আশা করতে পারেন। এর মানে হল 4GB VRAM, 16GB RAM সহ একটি ডেডিকেটেড GPU এবং মডেল এবং এর নির্ভরতা সংরক্ষণ করতে আপনার কম্পিউটারে প্রায় 12 থেকে 15GB ফাঁকা জায়গা।

  openjourney-ai-উৎপন্ন-ইমেজ
ইয়াদুল্লাহ আবিদি/মেকইউজঅফ/ওপেন জার্নি

ওপেনজার্নি দ্বারা উত্পন্ন চিত্রগুলি ফটোরিয়ালিজম এবং শিল্পের মধ্যে ভারসাম্যপূর্ণ হতে থাকে যদি না অন্যথায় নির্দিষ্ট করা হয়। আপনি যদি একটি অল-রাউন্ড মডেল খুঁজছেন এবং সাবস্ক্রিপশনের জন্য অর্থ প্রদান না করে মিডজার্নি চেহারা পছন্দ করেন, ওপেনজার্নি হল সেরা বিকল্পগুলির মধ্যে একটি।