গুগলের মিউজিকএলএম কি হাইপ পর্যন্ত লাইভ করে?

গুগলের মিউজিকএলএম কি হাইপ পর্যন্ত লাইভ করে?
আপনার মত পাঠকরা MUO সমর্থন করতে সাহায্য করে। আপনি যখন আমাদের সাইটে লিঙ্ক ব্যবহার করে একটি ক্রয় করেন, আমরা একটি অনুমোদিত কমিশন উপার্জন করতে পারি। আরও পড়ুন

জানুয়ারী 2023-এ, Google মিউজিকএলএম ঘোষণা করেছে, একটি পরীক্ষামূলক এআই টুল যা পাঠ্য বর্ণনার উপর ভিত্তি করে সঙ্গীত তৈরি করতে পারে। সংবাদের পাশাপাশি, গুগল মিউজিকএলএম-এর জন্য একটি অত্যাশ্চর্য গবেষণা পত্র প্রকাশ করেছে যা পাতলা বাতাস থেকে সঙ্গীতকে জাদু করার ক্ষমতা দেখে অনেক লোককে মুগ্ধ করেছে।





দিনের মেকইউজের ভিডিও কন্টেন্টের সাথে চালিয়ে যেতে স্ক্রোল করুন

একটি টেক্সট প্রম্পট দেওয়া হলে, মডেলটি উচ্চ বিশ্বস্ত সঙ্গীত তৈরি করার প্রতিশ্রুতি দেয় যা বিখ্যাত শিল্পকর্মের বর্ণনাকারী বিমূর্ত ক্যাপশন থেকে জেনার থেকে যন্ত্র পর্যন্ত সমস্ত ধরণের বর্ণনা প্রদান করে। এখন যেহেতু MusicLM জনসাধারণের জন্য উন্মুক্ত, আমরা এটি পরীক্ষা করার সিদ্ধান্ত নিয়েছি।





বিনামূল্যে ইমেলের সাথে সংযুক্ত অ্যাকাউন্টগুলি সন্ধান করুন

একটি এআই মিউজিক জেনারেটর তৈরি করার জন্য গুগলের প্রচেষ্টা

  গুগলের জন্য ওয়েব অ্যাপ্লিকেশন's MusicLM AI music generator

একটি রেডি-টু-প্লে ট্র্যাকে 'রিল্যাক্সিং জ্যাজ'-এর মতো টেক্সট প্রম্পটকে পরিণত করা তর্কাতীতভাবে এআই মিউজিকের পরীক্ষাগুলির পবিত্র গ্রিল। ডাল-ই বা মিডজার্নির মতো বিখ্যাত এআই ইমেজ জেনারেটরের মতো, সুর এবং বীট আছে এমন একটি ট্র্যাক তৈরি করতে আপনার কাছে মিউজিক জানা-কীভাবে জানার প্রয়োজন নেই।





2023 সালের মে মাসে, যারা Google-এর AI টেস্ট কিচেনে সাইন আপ করেছেন তারা প্রথমবারের মতো ডেমো ব্যবহার করে দেখতে পারেন। একটি ব্যবহারকারী-বান্ধব ওয়েব পৃষ্ঠা এবং কয়েকটি গাইডিং নিয়ম-ইলেকট্রনিক এবং ক্লাসিক্যাল ইন্সট্রুমেন্টগুলি সর্বোত্তম কাজ করে এবং একটি 'ভাইব' উল্লেখ করতে ভুলবেন না—সঙ্গীতের একটি স্নিপেট তৈরি করা অকল্পনীয়ভাবে সহজ।

তুলনামূলকভাবে উচ্চ বিশ্বস্ততার নমুনার পাশাপাশি মিউজিকএলএম সত্যিই যে কয়েকটি জিনিস সরবরাহ করে তার মধ্যে একটি গতি। যাইহোক, সত্যিকারের পরীক্ষাটি একা স্টপওয়াচ দিয়ে পরিমাপ করা যায় না। মিউজিকএলএম কি কয়েকটি শব্দের উপর ভিত্তি করে বাস্তব, শ্রবণযোগ্য সঙ্গীত তৈরি করতে পারে? ঠিক না (আমরা শীঘ্রই এটি পেতে হবে)।



গুগলের এআই টেস্ট কিচেনে মিউজিকএলএম কীভাবে ব্যবহার করবেন

MusicLM ব্যবহার করা সহজ, আপনি অপেক্ষা তালিকায় সাইন আপ করতে পারেন গুগলের এআই টেস্ট কিচেন যদি আপনি এটি একটি যেতে চান.

ওয়েব অ্যাপে, আপনি একটি পাঠ্য বাক্স দেখতে পাবেন যেখানে আপনি যে ধরণের সঙ্গীত শুনতে চান তা বর্ণনা করে কয়েকটি শব্দ থেকে কয়েকটি বাক্যে একটি প্রম্পট রচনা করতে পারেন। সেরা ফলাফলের জন্য, Google আপনাকে 'খুব বর্ণনামূলক হতে' পরামর্শ দেয়, যোগ করে যে আপনার মেজাজ এবং সঙ্গীতের আবেগ অন্তর্ভুক্ত করার চেষ্টা করা উচিত।





আপনি প্রস্তুত হলে, প্রক্রিয়াকরণ শুরু করতে এন্টার টিপুন। প্রায় 30 সেকেন্ডের মধ্যে, আপনার অডিশনের জন্য দুটি অডিও স্নিপেট উপলব্ধ হবে। দুটির মধ্যে, আপনার কাছে আপনার প্রম্পটের সাথে মেলে এমন সেরা নমুনাকে একটি ট্রফি দেওয়ার বিকল্প রয়েছে, যা ফলস্বরূপ Google কে মডেলটিকে প্রশিক্ষণ দিতে এবং এর আউটপুট উন্নত করতে সহায়তা করে৷

MusicLM কেমন শোনাচ্ছে

মানুষ অন্তত 40,000 বছর আগে থেকে সঙ্গীত তৈরি করে আসছে কোন নির্দিষ্ট ধারণা ছাড়াই যে সঙ্গীত আগে, পরে, বা একই সময়ে ভাষার বিকাশের সাথে এসেছিল কিনা। তাই কিছু উপায়ে, এটা আশ্চর্যজনক নয় যে মিউজিকএলএম এই প্রাচীন সার্বজনীন শিল্পের কোডটি পুরোপুরি ক্র্যাক করেনি।





গুগলের মিউজিকএলএম গবেষণা পত্র প্রস্তাবিত যে মিউজিকএলএম বিখ্যাত শিল্পকর্মের ক্যাপশন থেকে সঙ্গীত তৈরি করতে পারে এবং বিভিন্ন প্রম্পটের ক্রম অনুসরণ করে মসৃণ ফ্যাশনে জেনার বা মেজাজ পরিবর্তন করার মতো নির্দেশাবলী অনুসরণ করতে পারে।

এই ধরনের লম্বা আদেশের কাছাকাছি যাওয়ার আগে, যাইহোক, আমরা দেখেছি যে মিউজিকএলএম-এর প্রথমে কাটিয়ে উঠতে বেশ কয়েকটি মৌলিক সমস্যা ছিল।

টেম্পোতে লেগে থাকতে অসুবিধা

যেকোনো সঙ্গীতশিল্পীর সবচেয়ে মৌলিক কাজ হল সময়মতো খেলা। অন্য কথায়, টেম্পোতে লেগে থাকুন। আশ্চর্যজনকভাবে, এটি এমন কিছু নয় যা MusicLM 100% সময় করতে পারে।

প্রকৃতপক্ষে, একই প্রম্পট 10 বার ব্যবহার করে, যা 20টি মিউজিক ট্র্যাক তৈরি করে, সময় ছিল মাত্র তিনটি। অবশিষ্ট 17টি নমুনা নির্দিষ্ট টেম্পোর চেয়ে দ্রুত বা ধীর ছিল যা 'বিটস পার মিনিটে' লেখা ছিল, সঙ্গীত বর্ণনা করার জন্য একটি বহুল ব্যবহৃত শব্দ।

এই উদাহরণে, আমরা প্রম্পট ব্যবহার করেছি 'একক ক্লাসিক্যাল পিয়ানো প্রতি মিনিটে 80 বিটে বাজানো, শান্তিপূর্ণ এবং ধ্যানমূলক'। কাছাকাছি শ্রবণে, সঙ্গীত প্রায়ই ছোট নমুনার দৈর্ঘ্যের মধ্যে গতি বাড়ে বা ধীর হয়ে যায়।

মিউজিকেরও একটি শক্তিশালী বীট ছিল না এবং শোনাচ্ছিল যেন কেউ এই টুকরোটির মাঝপথে বাজিয়েছে। এটি ইচ্ছাকৃত ছিল বা না হোক, মিউজিকএলএম আসলেই বীটের সাথে লেগে থাকার উপরে মিউজিকের একটি অংশের সঠিক শুরু বা শেষ রচনা করতে পারে কিনা তা বিচার করা কঠিন করে তোলে।

এলোমেলো যন্ত্র নির্বাচন

সম্ভবত মিউজিকএলএম এখনও শিখেনি কীভাবে কঠোর সময়ে খেলতে হয়, তাই আমরা অন্য সাধারণ সঙ্গীত প্যারামিটারে চলে এসেছি। আমরা দেখতে চেয়েছিলাম এটি নির্দিষ্ট যন্ত্রের জন্য আমাদের অনুরোধ মঞ্জুর করবে কিনা।

আমরা 'সোলো সিনথেসাইজার' এবং 'সোলো বেস গিটার' এর মতো বর্ণনা অন্তর্ভুক্ত করে বিভিন্ন প্রম্পট লিখেছি। অন্যগুলি 'স্ট্রিং কোয়ার্টেট' বা 'জ্যাজ ব্যান্ড' এর মতো বড় ensembles ছিল। সামগ্রিকভাবে, এটি একটি 50:50 সুযোগের মতো মনে হয়েছিল আপনি যা চেয়েছেন তা পাবেন।

একটি তত্ত্ব হল যে মডেলটি জনপ্রিয় বাদ্যযন্ত্রের ঘরানার সাথে কিছু যন্ত্র যুক্ত করে। উদাহরণস্বরূপ, প্রম্পটটি নিন 'একক সংশ্লেষক, জ্যা অগ্রগতি। প্রাণবন্ত এবং উত্সাহী'। নিজে থেকে একটি সিন্থেসাইজার সাউন্ড পাওয়ার পরিবর্তে, মিউজিকএলএম ড্রাম এবং বেস সহ সম্পূর্ণ একটি ইলেকট্রনিক ট্র্যাক তৈরি করেছে।

এটা সম্ভব যে মডেলটিতে একটি যন্ত্রের জন্য নির্দিষ্ট অনুরোধ বোঝার জন্য পর্যাপ্ত ডেটা এবং পর্যাপ্ত প্রশিক্ষণ নেই।

ভোকাল সমীকরণের বাইরে

সেই সময়ে বিধিনিষেধ অনুসারে, মডেলটি কণ্ঠযুক্ত সঙ্গীত তৈরি করবে না। মিউজিকএলএম-এর কাঁটাযুক্ত কপিরাইট সমস্যা এবং বগি ভোকাল Google কেন এই সীমাবদ্ধতা সেট করে এটিকে নিরাপদে খেলতে বেছে নিয়েছে তার একটি সম্ভাব্য কারণ।

কিন্তু কিছু সময়ের জন্য মিউজিকএলএম নিয়ে পরীক্ষা-নিরীক্ষা করার পর, আমরা বুঝতে পেরেছি যে মডেলের আউটপুটের উপর গুগলের নিয়ন্ত্রণ ঠিক আয়রনক্ল্যাড ছিল না। অদ্ভুতভাবে, 'অ্যাকোস্টিক গিটার' এর মতো একটি প্রম্পট এমন একটি ট্র্যাক তৈরি করবে যার পটভূমিতে ভূতের মতো কণ্ঠস্বর রয়েছে যা ধাক্কাধাক্কি এবং দূরবর্তী শোনায়।

যদিও এটি একটি সাধারণ ঘটনা নয়, এটি আপনাকে প্রথম স্থানে বিশ্বাসযোগ্য কণ্ঠ তৈরি করার জন্য MusicLM এর ক্ষমতা সম্পর্কে বিস্ময় প্রকাশ করে।

VOCALOID এবং Synthesizer V-এর মতো সফ্টওয়্যার দিয়ে এগিয়ে যাচ্ছে এআই-সহায়তা ভোকাল সংশ্লেষণ প্রযুক্তি , বর্তমান মডেল থেকে ভোকাল বাদ দেওয়া আমাদের ভাবতে দেয় যে এটি বিদ্যমান প্রযুক্তির বিরুদ্ধে প্রতিদ্বন্দ্বিতা করার জন্য এখনও যথেষ্ট ভাল নয়। মিউজিশিয়ানরা এর প্রশংসা গাওয়ার আগে মিউজিকএলএম-কে অনেক দূর যেতে হবে।

এআই মিউজিক জেনারেটরদের ভবিষ্যত

  মিউজিকএলএম-এ বিভিন্ন প্রম্পট পরামর্শ's web application

যদিও মিউজিকএলএম জেনারেটিভ এআই মিউজিক টেকনোলজিকে এগিয়ে নিয়ে গেছে, মিউজিক ইন্ডাস্ট্রিতে ব্যবহারিক কাজ করার আগে এটিকে স্কুলে ফিরে যেতে হবে এবং আরও কিছু জিনিস শিখতে হবে।

এখন আগে, জেনারেটিভ এআই মিউজিকের সেরা প্রচেষ্টা ছিল ওপেনএআই দ্বারা জুকবক্সএআই নামে একটি মডেল। এটি ঠিক ব্যবহার করার জন্য প্রস্তুত অবস্থায় ছিল না, এবং মাত্র এক মিনিটের সঙ্গীত রেন্ডার করতে এটি প্রায় নয় ঘন্টা সময় নিয়েছে।

আপনার প্রচেষ্টার জন্য, আপনি অডিও বিকৃতি এবং শিল্পকর্মের সাথে ধাঁধাঁযুক্ত একটি সত্যিকারের এলিয়েন-সাউন্ডিং ট্র্যাক ফিরে পেতে পারেন। উল্টো দিকে, আপনি বিরক্ত হতে যাচ্ছেন না জুকবক্স জাদু করে এমন উদ্ভট সৃষ্টির কথা শুনছি .

এর আলোকে, MusicLM একটি ব্যবহারকারী-বান্ধব এআই মিউজিক জেনারেটরের দিকে কিছু উল্লেখযোগ্য অগ্রগতি করেছে। আমরা মডেলটিকে এর র্যান্ডম আউটপুটগুলির জন্য প্রায় ক্ষমা করতে পারি যখন আপনি ভাবতে থামেন যে কাঁচা অডিও আকারে সংগীত তৈরি করা কতটা জটিল।

মডেলটিকে কাজ করার পরে, তবে, Google তার প্রাথমিক গবেষণা পত্রে যা প্রকাশ করেছে তার তুলনায় মিউজিকএলএম অর্ধবেক বোধ করে। কদাচিৎ একটি এআই ইমেজ জেনারেটর অ্যাপলের ইমেজ ভুল পায়, একইভাবে একটি এআই মিউজিক জেনারেটরের টেম্পো এবং ইন্সট্রুমেন্টের মতো কিছু মৌলিক বিষয় পাওয়া উচিত।

উইন্ডোজ স্বয়ংক্রিয়ভাবে এই নেটওয়ার্কের প্রক্সি সেটিংস সনাক্ত করতে পারে না

গুগলের মিউজিকএলএম প্রত্যাশার কম

প্রযুক্তি সংস্থাগুলি AI ফ্রন্টে একে অপরকে ছাড়িয়ে যাওয়ার দৌড়ে, মিউজিকএলএম মনে হচ্ছে যেন এটি প্রস্তুত হওয়ার আগেই সর্বজনীন পরীক্ষায় প্রবেশ করেছে। মৌলিক অধিকার পাওয়ার পরিবর্তে, মডেলটি সঙ্গীত উত্পাদন করার জন্য অনেক বেশি অস্পষ্ট এবং বিষয়গত পদ্ধতি গ্রহণ করে বলে মনে হয়।

Google আপনাকে আপনার প্রম্পটের সাথে সুনির্দিষ্ট হতে উত্সাহিত করতে পারে, তবে এটি টেম্পোকে ভালভাবে পরিচালনা করতে পারে না এবং আপনি প্রতিবার যে যন্ত্রগুলি চেয়েছিলেন তা পাওয়ার নিশ্চয়তা নেই৷ মিউজিকএলএম আকর্ষণীয় হতে পারে, এবং শক্তিশালী এআই অগ্রগতির একটি ভাল প্রদর্শন, কিন্তু সঙ্গীত যদি শেষ লক্ষ্য হয় তবে এটি এখনও অনেক দূর যেতে হবে।