AVX-512 কী এবং কেন ইন্টেল এটি বন্ধ করছে?

AVX-512 কী এবং কেন ইন্টেল এটি বন্ধ করছে?

আপনার ডিভাইসের CPU প্রতি সেকেন্ডে লক্ষ লক্ষ গণনা করে এবং আপনার কম্পিউটার কীভাবে কাজ করে তার জন্য দায়ী৷ CPU এর সাথে কাজ করা হল অ্যারিথমেটিক প্রসেসিং ইউনিট (ALU), যা গাণিতিক কাজের জন্য দায়ী এবং CPUs মাইক্রোকোড দ্বারা চালিত হয়।





এখন, সেই CPU মাইক্রোকোডটি স্থির নয় এবং উন্নত করা যেতে পারে, এবং এরকম একটি উন্নতি ছিল ইন্টেলের AVX-512 নির্দেশনা সেট। যাইহোক, ইন্টেল AVX-512 কে মেরে ফেলতে সেট করেছে, ভালোর জন্য তার CPU গুলি থেকে এর কার্যকারিতা সরিয়ে দিচ্ছে। কিন্তু কেন? ইন্টেল কেন AVX-512 বন্ধ করছে?





দিনের মেকইউজের ভিডিও

কিভাবে একটি ALU কাজ করে?

AVX-512 নির্দেশনা সেটটি জানার আগে, একটি ALU কীভাবে কাজ করে তা বোঝা অপরিহার্য।





ব্যবহার করা ফাইল মুছে ফেলা যাবে না

নাম অনুসারে, গাণিতিক কাজগুলি সম্পাদন করতে গাণিতিক প্রক্রিয়াকরণ ইউনিট ব্যবহার করা হয়। এই কাজগুলির মধ্যে যোগ, গুণ, এবং ভাসমান-বিন্দু গণনার মতো ক্রিয়াকলাপ অন্তর্ভুক্ত। এই কাজগুলি সম্পন্ন করার জন্য, ALU অ্যাপ্লিকেশন-নির্দিষ্ট ডিজিটাল সার্কিট্রি ব্যবহার করে, যা CPU এর ঘড়ি সংকেত দ্বারা চালিত হয়।

অতএব, একটি CPU-র ঘড়ির গতি নির্দেশ করে যে হারে নির্দেশাবলী ALU-তে প্রক্রিয়া করা হয়। সুতরাং, যদি আপনার CPU 5GHz ক্লক ফ্রিকোয়েন্সিতে চলে, ALU এক সেকেন্ডে 5 বিলিয়ন নির্দেশাবলী প্রক্রিয়া করতে পারে। এই কারণে, ঘড়ির গতি বৃদ্ধির সাথে সাথে CPU কর্মক্ষমতা উন্নত হয়।



  একটি মাদারবোর্ডে চিপসেট

এটি বলেছিল, CPU ঘড়ির গতি বাড়ার সাথে সাথে CPU দ্বারা উত্পন্ন তাপের পরিমাণ বৃদ্ধি পায়। এই কারণে, পাওয়ার ব্যবহারকারীরা তাদের সিস্টেমগুলিকে ওভারক্লক করার সময় তরল নাইট্রোজেন ব্যবহার করে। দুর্ভাগ্যবশত, উচ্চ ফ্রিকোয়েন্সিতে তাপমাত্রার এই বৃদ্ধি CPU নির্মাতাদের একটি নির্দিষ্ট থ্রেশহোল্ডে ঘড়ির ফ্রিকোয়েন্সি বাড়ানো থেকে বাধা দেয়।

তাহলে কীভাবে একটি নতুন প্রজন্মের প্রসেসর পুরানো পুনরাবৃত্তির তুলনায় আরও ভাল পারফরম্যান্স অফার করে? ঠিক আছে, সিপিইউ নির্মাতারা পারফরম্যান্স বাড়ানোর জন্য সমান্তরালতার ধারণা ব্যবহার করে। এই সমান্তরালতা একটি মাল্টিকোর আর্কিটেকচার ব্যবহার করে অর্জন করা যেতে পারে যেখানে সিপিইউ-এর কম্পিউটেশনাল শক্তি উন্নত করতে বিভিন্ন প্রসেসিং কোর ব্যবহার করা হয়।





কর্মক্ষমতা উন্নত করার আরেকটি উপায় হল একটি SIMD নির্দেশনা সেট ব্যবহার করা। সহজ কথায়, একটি একক নির্দেশ একাধিক ডেটা নির্দেশ ALU-কে বিভিন্ন ডেটা পয়েন্ট জুড়ে একই নির্দেশ কার্যকর করতে সক্ষম করে। এই ধরনের সমান্তরালতা একটি CPU-এর কর্মক্ষমতা উন্নত করে, এবং AVX-512 হল একটি SIMD নির্দেশনা যা নির্দিষ্ট কাজ সম্পাদন করার সময় একটি CPU-এর কর্মক্ষমতা বাড়াতে ব্যবহৃত হয়।

কিভাবে ডেটা ALU এ পৌঁছায়?

এখন যেহেতু একটি ALU কিভাবে কাজ করে সে সম্পর্কে আমাদের প্রাথমিক ধারণা আছে, আমাদের বুঝতে হবে কিভাবে ডেটা ALU-তে পৌঁছায়।





  একটি খালি ব্যাকগ্রাউন্ড সহ হার্ড ড্রাইভ

ALU-তে পৌঁছানোর জন্য, ডেটাকে বিভিন্ন স্টোরেজ সিস্টেমের মধ্য দিয়ে যেতে হয়। এই ডেটা যাত্রা একটি কম্পিউটিং সিস্টেমের মেমরি শ্রেণিবিন্যাসের উপর ভিত্তি করে। এই অনুক্রমের একটি সংক্ষিপ্ত বিবরণ নীচে দেওয়া হল:

  • সেকেন্ডারি মেমরি: একটি কম্পিউটিং ডিভাইসের সেকেন্ডারি মেমরি একটি স্থায়ী স্টোরেজ ডিভাইস নিয়ে গঠিত। এই ডিভাইসটি স্থায়ীভাবে ডেটা সঞ্চয় করতে পারে কিন্তু CPU এর মত দ্রুত নয়। এই কারণে, সিপিইউ সরাসরি সেকেন্ডারি স্টোরেজ সিস্টেম থেকে ডেটা অ্যাক্সেস করতে পারে না।
  • প্রাথমিক স্মৃতি: প্রাথমিক স্টোরেজ সিস্টেম র্যান্ডম অ্যাক্সেস মেমরি (RAM) নিয়ে গঠিত। এই স্টোরেজ সিস্টেমটি সেকেন্ডারি স্টোরেজ সিস্টেমের চেয়ে দ্রুত কিন্তু স্থায়ীভাবে ডেটা সংরক্ষণ করতে পারে না। অতএব, আপনি যখন আপনার সিস্টেমে একটি ফাইল খুলবেন, তখন এটি হার্ড ড্রাইভ থেকে RAM এ চলে যায়। এটি বলেছে, এমনকি RAM CPU-এর জন্য যথেষ্ট দ্রুত নয়।
  • ক্যাশ মেমরি: ক্যাশে মেমরি সিপিইউতে এম্বেড করা হয় এবং এটি একটি কম্পিউটারে দ্রুততম মেমরি সিস্টেম। এই মেমরি সিস্টেম তিনটি ভাগে বিভক্ত, যথা L1, L2, এবং L3 ক্যাশে . ALU দ্বারা প্রসেস করা প্রয়োজন এমন যেকোনো ডেটা হার্ড ড্রাইভ থেকে RAM এবং তারপর ক্যাশে মেমরিতে চলে যায়। যে বলে, ALU সরাসরি ক্যাশে থেকে ডেটা অ্যাক্সেস করতে পারে না।
  • CPU নিবন্ধন: একটি কম্পিউটিং ডিভাইসে সিপিইউ রেজিস্টার আকারে খুব ছোট, এবং কম্পিউটারের আর্কিটেকচারের উপর ভিত্তি করে, এই রেজিস্টারগুলি 32 বা 64 বিট ডেটা ধারণ করতে পারে। একবার ডেটা এই রেজিস্টারগুলিতে চলে গেলে, ALU এটি অ্যাক্সেস করতে পারে এবং হাতে কাজ সম্পাদন করতে পারে।

AVX-512 কী এবং এটি কীভাবে কাজ করে?

AVX 512 নির্দেশনা সেটটি AVX-এর দ্বিতীয় পুনরাবৃত্তি এবং 2013 সালে ইন্টেল প্রসেসরে প্রবেশ করে। অ্যাডভান্সড ভেক্টর এক্সটেনশনের জন্য সংক্ষিপ্ত, AVX নির্দেশ সেটটি প্রথমে ইন্টেলের Xeon Phi (নাইটস ল্যান্ডিং) আর্কিটেকচারে চালু করা হয়েছিল এবং পরে এটি ইন্টেলের সার্ভারে তৈরি করা হয়েছিল। Skylake-X CPU-তে প্রসেসর।

এছাড়াও, AVX-512 নির্দেশনা সেটটি ক্যানন লেক আর্কিটেকচারের সাথে ভোক্তা-ভিত্তিক সিস্টেমে প্রবেশ করেছে এবং পরে আইস লেক এবং টাইগার লেক আর্কিটেকচার দ্বারা সমর্থিত হয়েছিল।

এই নির্দেশ সেটের মূল লক্ষ্য ছিল ডেটা কম্প্রেশন, ইমেজ প্রসেসিং এবং ক্রিপ্টোগ্রাফিক কম্পিউটেশনের সাথে জড়িত কাজগুলিকে ত্বরান্বিত করা। পুরানো পুনরাবৃত্তির তুলনায় দ্বিগুণ গণনা শক্তি অফার করে, AVX-512 নির্দেশনা সেট যথেষ্ট কর্মক্ষমতা লাভের প্রস্তাব দেয়।

তাহলে, AVX-512 আর্কিটেকচার ব্যবহার করে ইন্টেল কীভাবে তার CPU-এর কর্মক্ষমতা দ্বিগুণ করেছে?

ঠিক আছে, যেমন আগে ব্যাখ্যা করা হয়েছে, ALU শুধুমাত্র একটি CPU এর রেজিস্টারে উপস্থিত ডেটা অ্যাক্সেস করতে পারে। অ্যাডভান্সড ভেক্টর এক্সটেনশন নির্দেশনা সেট এই রেজিস্টারের আকার বাড়ায়।

আকারের এই বৃদ্ধির কারণে, ALU একটি একক নির্দেশে একাধিক ডেটা পয়েন্ট প্রক্রিয়া করতে পারে, সিস্টেমের কর্মক্ষমতা বৃদ্ধি করে।

রেজিস্টারের আকারের ক্ষেত্রে, AVX-512 নির্দেশনা সেটটি বত্রিশটি 512-বিট রেজিস্টার অফার করে, যা পুরোনো AVX নির্দেশ সেটের তুলনায় দ্বিগুণ।

কেন ইন্টেল AVX-512 শেষ করছে?

যেমনটি আগে ব্যাখ্যা করা হয়েছে, AVX-512 নির্দেশ সেটটি বেশ কয়েকটি গণনীয় সুবিধা প্রদান করে। প্রকৃতপক্ষে, TensorFlow-এর মতো জনপ্রিয় লাইব্রেরিগুলি নির্দেশনা সেটকে সমর্থনকারী CPU-তে দ্রুত গণনা প্রদান করতে নির্দেশনা সেট ব্যবহার করে।

আমার কেন শুধু দুটি স্ন্যাপচ্যাট ফিল্টার আছে?

তাহলে, কেন ইন্টেল তার সাম্প্রতিক অ্যাল্ডার লেক প্রসেসরগুলিতে AVX-512 অক্ষম করছে?

ঠিক আছে, অল্ডার লেক প্রসেসরগুলি ইন্টেল দ্বারা নির্মিত পুরানোগুলির থেকে ভিন্ন। পুরানো সিস্টেমগুলি একই আর্কিটেকচারে চলমান কোর ব্যবহার করলে, অ্যাল্ডার লেক প্রসেসর দুটি ভিন্ন কোর ব্যবহার করে। অ্যাল্ডার লেকের এই কোরগুলি সিপিইউ হিসাবে পরিচিত পি এবং ই-কোর এবং বিভিন্ন আর্কিটেকচার দ্বারা চালিত হয়.

পি-কোরগুলি গোল্ডেন কোভ মাইক্রোআর্কিটেকচার ব্যবহার করলে, ই-কোরগুলি গ্রেসমন্ট মাইক্রোআর্কিটেকচার ব্যবহার করে। আর্কিটেকচারের এই পার্থক্যটি সময়সূচীকে সঠিকভাবে কাজ করতে বাধা দেয় যখন নির্দিষ্ট নির্দেশাবলী একটি আর্কিটেকচারে চলতে পারে কিন্তু অন্যটিতে নয়।

অ্যাল্ডার লেক প্রসেসরের ক্ষেত্রে, AVX-512 নির্দেশনা সেটটি এমন একটি উদাহরণ, কারণ পি-কোরগুলিতে নির্দেশ প্রক্রিয়া করার জন্য হার্ডওয়্যার রয়েছে, কিন্তু ই-কোরগুলিতে তা নেই৷

এই কারণে, Alder Lake CPU গুলি AVX-512 নির্দেশ সেট সমর্থন করে না।

এটি বলেছে, AVX-512 নির্দেশনা নির্দিষ্ট অ্যাল্ডার লেক সিপিইউতে চলতে পারে যেখানে ইন্টেল তাদের শারীরিকভাবে মিশ্রিত করেনি। এটি করার জন্য, ব্যবহারকারীদের BIOS চলাকালীন ই-কোরগুলি নিষ্ক্রিয় করতে হবে।

বিনা মূল্যে কারো সম্পর্কে ব্যক্তিগত তথ্য কিভাবে বের করা যায়

AVX-512 কি কনজিউমার চিপসেটের জন্য প্রয়োজন?

AVX-512 নির্দেশনা সেটটি একটি CPU এর রেজিস্টারের কার্যক্ষমতা বাড়াতে এর আকার বাড়ায়। পারফরম্যান্সে এই বৃদ্ধি CPU-গুলিকে দ্রুত সংখ্যা ক্রাঞ্চ করতে সক্ষম করে, ব্যবহারকারীদের দ্রুত গতিতে ভিডিও/অডিও কম্প্রেশন অ্যালগরিদম চালানোর অনুমতি দেয়।

এটি বলেছে, কর্মক্ষমতার এই বৃদ্ধি শুধুমাত্র তখনই লক্ষ্য করা যেতে পারে যখন একটি প্রোগ্রামে সংজ্ঞায়িত নির্দেশ AVX-512 নির্দেশ সেটে চালানোর জন্য অপ্টিমাইজ করা হয়।

এই কারণে, AVX-512-এর মতো নির্দেশনা সেট আর্কিটেকচারগুলি সার্ভারের কাজের চাপের জন্য আরও উপযুক্ত, এবং ভোক্তা-গ্রেড চিপসেটগুলি AVX-512-এর মতো জটিল নির্দেশনা সেট ছাড়াই কাজ করতে পারে।