GPT-5: 4 নতুন বৈশিষ্ট্য আমরা দেখতে চাই

GPT-5: 4 নতুন বৈশিষ্ট্য আমরা দেখতে চাই

দ্রুত লিঙ্ক

OpenAI এর GPT-4 বর্তমানে বাজারে সেরা জেনারেটিভ এআই টুল, কিন্তু এর মানে এই নয় যে আমরা ভবিষ্যতের দিকে তাকাচ্ছি না। OpenAI সিইও স্যাম অল্টম্যান নিয়মিত GPT-5 সম্পর্কে ইঙ্গিত দিয়ে যাচ্ছেন, মনে হচ্ছে আমরা অনেক আগেই একটি নতুন, আপগ্রেড করা AI মডেল দেখতে পাব।





দিনের MUO ভিডিও কন্টেন্টের সাথে চালিয়ে যেতে স্ক্রোল করুন

অন্তত, আমরা কি আশা করছি. GPT-5 এর জন্য কোন নির্দিষ্ট লঞ্চের তারিখ নেই, এবং আমরা যা জানি তার বেশিরভাগই আসে অন্যান্য তথ্য একত্রিত করা এবং বিন্দুগুলিকে সংযুক্ত করার চেষ্টা করার মাধ্যমে।





স্ন্যাপচ্যাটে সব ট্রফি কি

তারপরও, নির্ধারিত তারিখ যাই হোক না কেন, GPT-5 কখন লঞ্চ হয় তা আমরা দেখতে চাই।





OpenAI এর GPT-5 কি?

GPT-5 হল OpenAI-এর GPT-4 AI মডেলের অত্যন্ত প্রত্যাশিত উত্তরসূরি, যা বাজারে সবচেয়ে শক্তিশালী জেনারেটিভ মডেল বলে প্রত্যাশিত। যদিও GPT-5-এর জন্য বর্তমানে কোনো আনুষ্ঠানিক প্রকাশের তারিখ নেই, সেখানে ইঙ্গিত রয়েছে যে এটি 2024 সালের গ্রীষ্মের প্রথম দিকে প্রকাশিত হতে পারে। এই সময়ে মডেল সম্পর্কে খুব কম বিশদ জানা যায়, তবে কিছু পরিমাণের সাথে বেশ কিছু জিনিস বলা যেতে পারে। নিশ্চিততা:

এই সব একটি উত্তেজনাপূর্ণ বাস্তবতা নির্দেশ: GPT-5 আসছে! যে বলেন, বেশ কিছু জিনিস এই মুহুর্তে জল্পনা. কিন্তু এমন কিছু জিনিস রয়েছে যা আমরা দেখতে আশা করি এবং মডেলটিতে দেখতে মোটামুটি আত্মবিশ্বাসী। এখানে তাদের কিছু:



1. আরও মাল্টিমোডালিটি

  OpenAI Sora টেক্সট-টু-ভিডিও জেনারেটর

AI মডেলের GPT ফ্যামিলির সবচেয়ে উত্তেজনাপূর্ণ উন্নতিগুলির মধ্যে একটি হল মাল্টিমোডালিটি। স্বচ্ছতার জন্য, মাল্টিমোডালিটি হল একটি এআই মডেলের ক্ষমতা যা শুধু টেক্সট ছাড়াও ছবি, অডিও এবং ভিডিওর মতো অন্যান্য ধরনের ইনপুট প্রক্রিয়া করার ক্ষমতা। মাল্টিমোডালিটি এগিয়ে যাওয়া মডেলগুলির GPT পরিবারের জন্য একটি গুরুত্বপূর্ণ অগ্রগতি বেঞ্চমার্ক হবে।

GPT-4 ইতিমধ্যেই ইমেজ ইনপুট এবং আউটপুট পরিচালনায় পারদর্শী, অডিও এবং ভিডিও প্রক্রিয়াকরণের উন্নতিগুলি OpenAI-এর জন্য পরবর্তী মাইলফলক, এবং GPT-5 শুরু করার জন্য একটি ভাল জায়গা। গুগল ইতিমধ্যে তার জেমিনি এআই মডেলের সাথে এই ধরণের মাল্টিমোডালিটি নিয়ে গুরুতর অগ্রগতি করছে। ওপেনএআই-এর সাড়া না দেওয়া অস্বাভাবিক হবে। কিন্তু, অবশ্যই, এটার জন্য আমাদের শব্দ গ্রহণ করবেন না. তার মধ্যে আমাকে পডকাস্টকে বিভ্রান্ত করুন [পিডিএফ ট্রান্সক্রিপ্ট], বিল গেটস ওপেনএআই সিইও স্যাম অল্টম্যানকে জিজ্ঞাসা করেছিলেন যে তিনি পরবর্তী দুই বছরে GPT সিরিজের জন্য কী কী মাইলফলক দেখেছিলেন। তার প্রথম উত্তর? ভিডিও প্রসেসিং।





সুতরাং, GPT-5-এর জন্য, আমরা ভিডিওগুলির সাথে প্লে করতে সক্ষম হব—প্রম্পট হিসাবে ভিডিওগুলি আপলোড করতে, যেতে যেতে ভিডিও তৈরি করতে, পাঠ্য প্রম্পট সহ ভিডিও সম্পাদনা করতে, ভিডিওগুলি থেকে অংশগুলি বের করতে এবং বড় ভিডিও ফাইলগুলি থেকে নির্দিষ্ট দৃশ্যগুলি খুঁজে পেতে সক্ষম হওয়ার আশা করি৷ আমরা আশা করি অডিও ফাইলগুলির অনুরূপ জিনিসগুলি করতে সক্ষম হব। এটি একটি বড় জিজ্ঞাসা, হ্যাঁ. কিন্তু এআই ডেভেলপমেন্ট কতটা দ্রুত, এটা খুবই যুক্তিসঙ্গত প্রত্যাশা।

2. আরও বড় এবং আরও দক্ষ প্রসঙ্গ উইন্ডো

  OpenAI লোগো সহ একটি ডেস্কে মনিটর করুন
রাল্ফ জেটনার বোর্জা/ ফ্লিকার

বাজারে সবচেয়ে অত্যাধুনিক AI মডেলগুলির মধ্যে একটি হওয়া সত্ত্বেও, AI মডেলগুলির GPT পরিবারে সবচেয়ে ছোট কনটেক্সট উইন্ডোগুলির একটি রয়েছে৷ এই ক্ষেত্রে, Anthropic's Claude 3 200,000 টোকেনের একটি প্রসঙ্গ উইন্ডো গর্ব করে , যখন গুগলের জেমিনি একটি বিস্ময়কর 1 মিলিয়ন টোকেন প্রক্রিয়া করতে পারে (প্রমিত ব্যবহারের জন্য 128,000)। বিপরীতে, GPT-4 এর 128,000 টোকেনগুলির একটি অপেক্ষাকৃত ছোট প্রসঙ্গ উইন্ডো রয়েছে, যার মধ্যে প্রায় 32,000 টোকেন বা তার চেয়ে কম বাস্তবসম্মতভাবে ChatGPT-এর মতো ইন্টারফেসে ব্যবহারের জন্য উপলব্ধ।





উন্নত মাল্টিমোডালিটি ছবিতে আসার সাথে সাথে একটি উন্নত প্রসঙ্গ উইন্ডো প্রায় অনিবার্য। হয়তো দুই বা চারের একটি ফ্যাক্টর দ্বারা বৃদ্ধি যথেষ্ট হবে, কিন্তু আমরা দশের একটি ফ্যাক্টরের মতো কিছু দেখতে আশা করি। এটি GPT-5-কে অনেক বেশি দক্ষ পদ্ধতিতে আরও অনেক তথ্য প্রক্রিয়া করার অনুমতি দেবে। এখন, একটি বড় প্রসঙ্গ উইন্ডো সবসময় ভাল মানে না। সুতরাং, শুধুমাত্র প্রসঙ্গ উইন্ডো বাড়ানোর পরিবর্তে, আমরা প্রসঙ্গ প্রক্রিয়াকরণের একটি বর্ধিত দক্ষতা দেখতে চাই।

আপনি দেখতে পাচ্ছেন, একটি মডেলের একটি মিলিয়ন টোকেন প্রসঙ্গ উইন্ডো থাকতে পারে (প্রায় 700,000 শব্দের ক্ষমতা) কিন্তু একটি 500,000-শব্দের বইয়ের সংক্ষিপ্তসার করতে বলা হলে একটি বিস্তৃত সারাংশ তৈরি করতে ব্যর্থ হয় কারণ এটি থাকা সত্ত্বেও প্রসঙ্গটির সম্পূর্ণতা পর্যাপ্তভাবে প্রক্রিয়া করতে পারে না। তাত্ত্বিকভাবে তা করার ক্ষমতা। আপনি একটি 500k-শব্দের বই পড়তে পারেন এর অর্থ এই নয় যে আপনি এটির সমস্ত কিছু মনে রাখতে পারেন বা এটি সংবেদনশীলভাবে প্রক্রিয়া করতে পারেন।

3. GPT এজেন্ট

  একটি স্মার্টফোনে ChatGPT অ্যাক্সেস করা হয়েছে
কোশিরো কে/ শাটারস্টক

সম্ভবত একটি GPT-5 প্রকাশের সবচেয়ে উত্তেজনাপূর্ণ সম্ভাবনাগুলির মধ্যে একটি হল GPT এজেন্টদের আত্মপ্রকাশ। যদিও 'গেম-চেঞ্জার' শব্দটি সম্ভবত AI-তে অতিরিক্ত ব্যবহার করা হয়েছে, GPT এজেন্টরা বাস্তবিক অর্থে প্রতিটি অর্থে গেম-চেঞ্জার হবে। কিন্তু এটা কিভাবে খেলা পরিবর্তন হবে?

বর্তমানে, GPT-4 এর মত AI মডেল আপনাকে একটি টাস্ক সম্পূর্ণ করতে সাহায্য করতে পারে। তারা একটি ইমেল লিখতে পারে, একটি কৌতুক ক্র্যাক করতে পারে, একটি গণিত সমস্যা সমাধান করতে পারে বা আপনার জন্য একটি ব্লগ পোস্টের খসড়া তৈরি করতে পারে৷ যাইহোক, তারা শুধুমাত্র সেই নির্দিষ্ট কাজটি করতে পারে এবং আপনার কাজটি সম্পূর্ণ করার জন্য প্রয়োজনীয় সম্পর্কিত কাজের একটি সেট সম্পূর্ণ করতে পারে না।

ধরা যাক আপনি একজন ওয়েব ডেভেলপার। আপনার কাজের অংশ হিসাবে, আপনি অনেক কিছু করবেন বলে আশা করা হচ্ছে: ডিজাইন, কোড লিখুন, সমস্যা সমাধান এবং আরও অনেক কিছু। বর্তমানে, আপনি একবারে এআই মডেলগুলিতে এই কাজের একটি অংশ অর্পণ করতে পারেন। হয়তো আপনি GPT-4 মডেলকে হোম পেজের জন্য একটি কোড লিখতে বলতে পারেন, তারপরে যোগাযোগ পৃষ্ঠার জন্য এবং তারপর সম্পর্কে পৃষ্ঠা ইত্যাদির জন্য এটি করতে বলুন৷ আপনাকে এই কাজগুলি পুনরাবৃত্তিমূলকভাবে সম্পূর্ণ করতে হবে৷ এবং এমন কিছু কাজ রয়েছে যা মডেলগুলি কেবল সম্পূর্ণ করতে পারে না।

নির্দিষ্ট সাবটাস্কের জন্য এআই মডেলকে অনুরোধ করার এই পুনরাবৃত্তিমূলক প্রক্রিয়াটি সময়সাপেক্ষ এবং অদক্ষ। এই পরিস্থিতিতে, আপনি—ওয়েব ডেভেলপার—আপনি একজন মানবিক এজেন্ট যিনি AI মডেলগুলিকে এক সময়ে একটি টাস্ক সমন্বয় এবং প্রম্পট করার জন্য দায়ী যতক্ষণ না আপনি সম্পর্কিত টাস্কগুলির একটি সম্পূর্ণ সেট সম্পূর্ণ করেন৷

GPT এজেন্টরা আশা করি, GPT-5 দ্বারা সমন্বিত বিশেষ বিশেষজ্ঞ বটগুলিকে প্রতিশ্রুতি দেয় যে স্বয়ং-প্রম্পট করতে এবং একটি জটিল কাজের সমস্ত উপসেটকে স্বায়ত্তশাসিতভাবে মোকাবেলা করতে সক্ষম। 'স্ব-প্রোম্পটিং' এবং 'স্বায়ত্তশাসিত' এর উপর জোর দেওয়া।

তাই, যদি GPT-5 GPT এজেন্টদের সাথে পাঠানো হয়, তাহলে আপনি এটিকে 'ম্যাক্সওয়েল টিমোথির জন্য একটি পোর্টফোলিও ওয়েবসাইট তৈরি করতে' চাইতে পারেন 'আমাকে হোমপেজের জন্য একটি কোড লিখুন।' GPT-5 তখন তাত্ত্বিকভাবে একটি ওয়েবসাইট তৈরি করার জন্য প্রয়োজনীয় বিভিন্ন সাবটাস্কগুলি পরিচালনা করার জন্য বিশেষজ্ঞ এআই এজেন্টদের আহ্বান করে স্ব-প্রম্পট করতে সক্ষম হবে। এটি ম্যাক্সওয়েল টিমোথির তথ্যের জন্য ওয়েব স্ক্র্যাপ করার জন্য একটি GPT, বিভিন্ন পৃষ্ঠার জন্য কোড লেখার জন্য অন্য এজেন্ট, চিত্র তৈরি এবং অপ্টিমাইজ করার জন্য অন্য এজেন্ট, এমনকি সাইট স্থাপন করার জন্য অন্য AI এজেন্টকে অনুরোধ করতে পারে, সব কিছু বারবার মানুষের প্রয়োজন ছাড়াই। প্রম্পটিং

4. কম হ্যালুসিনেশন

যদিও ওপেনএআই তার AI মডেলগুলিতে হ্যালুসিনেশনের সাথে মোকাবিলা করার জন্য অনেক দূর এগিয়েছে, GPT-5 এর জন্য সত্যিকারের লিটমাস পরীক্ষা হবে হ্যালুসিনেশনের ক্রমাগত সমস্যা মোকাবেলা করার ক্ষমতা, যা AI এর ব্যাপক গ্রহণকে আটকে রেখেছে, স্বাস্থ্যসেবা, বিমান চলাচল এবং সাইবার নিরাপত্তার মতো নিরাপত্তা-সমালোচনামূলক ডোমেন। এগুলি এমন সমস্ত ক্ষেত্র যা ভারী AI সম্পৃক্ততা থেকে ব্যাপকভাবে উপকৃত হবে কিন্তু বর্তমানে কোন উল্লেখযোগ্য গ্রহণ এড়িয়ে চলছে।

স্পষ্টতার জন্য, এই প্রসঙ্গে হ্যালুসিনেশন বলতে এমন পরিস্থিতি বোঝায় যেখানে AI মডেল উচ্চ মাত্রার আত্মবিশ্বাসের সাথে প্রশংসনীয়-শব্দযুক্ত কিন্তু সম্পূর্ণ বানোয়াট তথ্য তৈরি করে এবং উপস্থাপন করে।

একটি দৃশ্যকল্প কল্পনা করুন যেখানে রোগীর লক্ষণ এবং চিকিৎসা প্রতিবেদন বিশ্লেষণের জন্য একটি ডায়াগনস্টিক সিস্টেমে GPT-4 সংহত করা হয়েছে। একটি হ্যালুসিনেশন AI কে আত্মবিশ্বাসের সাথে একটি ভুল নির্ণয় প্রদান করতে বা কল্পনাকৃত তথ্য এবং মিথ্যা যুক্তির উপর ভিত্তি করে একটি সম্ভাব্য বিপজ্জনক চিকিত্সার পরামর্শ দিতে পারে। চিকিৎসা ক্ষেত্রে এ ধরনের ত্রুটির পরিণতি হতে পারে বিপর্যয়কর।

অনুরূপ সংরক্ষণগুলি অন্যান্য উচ্চ-পরিণাম ক্ষেত্রগুলিতে প্রযোজ্য, যেমন বিমান চালনা, পারমাণবিক শক্তি, সামুদ্রিক অপারেশন এবং সাইবার নিরাপত্তা। আমরা আশা করি না যে GPT-5 সম্পূর্ণরূপে হ্যালুসিনেশন সমস্যা সমাধান করবে, তবে আমরা আশা করি এটি এই ধরনের ঘটনার সম্ভাবনা উল্লেখযোগ্যভাবে হ্রাস করবে।

যেহেতু আমরা এই অত্যন্ত প্রত্যাশিত AI মডেলের আনুষ্ঠানিক প্রকাশের জন্য অধীর আগ্রহে অপেক্ষা করছি, একটি বিষয় নিশ্চিত: GPT-5 কৃত্রিম বুদ্ধিমত্তা দিয়ে যা সম্ভব তার সীমানা পুনর্নির্ধারণ করার ক্ষমতা রাখে, যা মানব-মেশিন সহযোগিতা এবং উদ্ভাবনের একটি নতুন যুগের সূচনা করে।

আপনি কিভাবে আইফোনে একটি গ্রুপ টেক্সট রেখে যান