ক্যাট স্পিচ ট্রান্সলেশন অ্যাপস কিভাবে কাজ করে?

ক্যাট স্পিচ ট্রান্সলেশন অ্যাপস কিভাবে কাজ করে?

আপনি সম্ভবত এমন অ্যাপ দেখেছেন যা আপনার বিড়াল যা বলছে তা অনুবাদ করার দাবি করে। কিন্তু তারা কি সত্যিই আপনার বিড়ালের মায়ু ইংরেজিতে অনুবাদ করতে পারে? সংক্ষিপ্ত উত্তর হল হ্যাঁ, সাজানো। প্রতিটি বিড়ালের 'ভাষা' কতটা অনন্য তার জন্য এটি কঠিন, তবে তারা আধুনিক প্রযুক্তির সাথে বেশ কাছাকাছি যেতে পারে।





MeowTalk এর মত ক্যাট ট্রান্সলেশন অ্যাপস স্পিচ রিকগনিশন এর একটি ফর্ম ব্যবহার করে যা মেশিন লার্নিং এর উপর জোর দেয়। আসুন কাছ থেকে দেখি।





বক্তৃতা স্বীকৃতি এবং মেশিন লার্নিং

মেরি থেরেসা ম্যাকলিন/ পিক্সাবে





স্পিচ রিকগনিশন স্পিচ রেকর্ডিং এবং অডিওকে ডিজিটাল ডেটা ফাইলে পরিণত করে কাজ করে। এটি পিচ এবং ভলিউমের মতো ডেটাকে ডেটা পয়েন্ট হিসাবে এনকোড করে যা অ্যাপ বিশ্লেষণ করতে পারে এবং অর্থের সাথে মেলে। ডিপিএ মাইক্রোফোন ব্যাখ্যা করে যে এই ডেটা পয়েন্টগুলি পটভূমির শব্দ এবং কীভাবে একটি শব্দ বলা হয় তার উপর নির্ভর করে খুব আলাদা দেখতে পারে।

আমরা মাঝে মাঝে ভয়েস রিকগনিশনকে মঞ্জুর মনে করি, কিন্তু এটি প্রযুক্তির একটি অবিশ্বাস্য কীর্তি। বিশেষ করে মানুষের বক্তৃতা কতটা জটিল তা বিবেচনা করে। যেমন বিজ্ঞানী ব্যাখ্যা করে, প্রতিটি শব্দের বিস্তৃত শব্দ বা 'ফোনেমস' একে অপরের সাথে মিশে থাকে। বক্তৃতা বোঝার জন্য একটি কম্পিউটার পাওয়া খুব কঠিন। বিড়ালের শব্দগুলির নতুন সীমানা আরও কঠিন হবে।



যেসব অ্যাপ স্পিচ রিকগনিশন ব্যবহার করে, তাদের ডেটাসেট নামক শব্দের 'শব্দভান্ডার' দিয়ে প্রোগ্রাম করা হয়। অ্যাপটি তারপর আপনার বক্তৃতাটি তার ডেটা-ভোকাবুলারির নিকটতম বিকল্পের সাথে মেলে।

যখন এটি একটি ভুল করে, আপনি এটি সংশোধন করেন, এবং এটি পরবর্তী সময়ের জন্য সেই ডেটা সংরক্ষণ করে। এটি মেশিন লার্নিং এর অংশ। এটি কিভাবে একটি প্রোগ্রাম বক্তৃতা চিনতে শিখতে পারে এমনকি যখন এটি ডেটাসেটের সাথে অভিন্ন নয় যা দিয়ে শুরু হয়েছিল।





সম্পর্কিত: মেশিন লার্নিং অ্যালগরিদম কি? এখানে তারা কিভাবে কাজ করে

ভয়েস স্বীকৃতি এখনও সমস্যা আছে, বিশেষ করে বক্তৃতা বাধা এবং উচ্চারণ সঙ্গে। যদিও কিছু কোম্পানি এই সমস্যাগুলি কাটিয়ে উঠতে মেশিন লার্নিং উন্নত করছে। সময়ের সাথে সাথে, মেশিন লার্নিং স্পিচ রিকগনিশনকে একটি শক্তিশালী হাতিয়ারে পরিণত করতে পারে।





আইফোন থেকে পিসিতে ছবি স্থানান্তর করার সেরা উপায়

এভাবেই মানুষের জন্য বক্তৃতা স্বীকৃতি কাজ করে। কিন্তু এটা কি বিড়ালের জন্য কাজ করে?

বক্তৃতা স্বীকৃতি বনাম মিয়াউ স্বীকৃতি

আরিয়ানা সুয়ারেজ / আনস্প্ল্যাশ

প্রথমত, আমাদের বুঝতে হবে কেন একটি নির্দিষ্ট ধরনের মিয়াউকে 'আমি ক্ষুধার্ত' হিসেবে অনুবাদ করা মানুষের বক্তৃতা বিশ্লেষণের থেকে আলাদা। সমস্যাটি বেশিরভাগই যে বিড়ালের যোগাযোগ ভঙ্গির মতো অকথ্য ইঙ্গিতগুলির উপর বেশি নির্ভর করে। আরেকটি সমস্যা হল একটি সার্বজনীন 'বিড়াল ভাষার' অনুপস্থিতি।

অনুযায়ী ASPCA , প্রাপ্তবয়স্ক হিংস্র বিড়াল কখনোই একে অপরের কাছে না, শুধুমাত্র মানুষের দিকে। দ্বারা অন্যান্য গবেষণা মানব সমাজ যোগ করে যে এই শব্দগুলি 'ভ্যাকুয়ামে ঘটে না।' বডি ল্যাঙ্গুয়েজ এবং অন্যান্য প্রসঙ্গের পাশাপাশি আমাদের অবশ্যই তাদের ব্যাখ্যা করতে হবে। অনেক ক্ষেত্রে, এই নীরব সংকেতগুলি কেবল একটি মায়ুর মধ্যে পার্থক্য যার অর্থ 'আমি ক্ষুধার্ত' এবং যার অর্থ 'আমি খেলতে চাই।'

এই সমস্যা যোগ করা, কোন দুটি বিড়াল একই ভাষা আছে। বিড়াল তাদের মালিকদের জন্য ব্যক্তিগতকৃত 'ভাষা' বিকাশ করে। এগুলি আংশিকভাবে মালিকের কণ্ঠের অনুকরণ এবং আংশিকভাবে বিড়ালের ব্যক্তিত্বের উপর ভিত্তি করে। কোন দুটি বিড়াল একই শব্দ করে, এমনকি যখন একই ইচ্ছা বা প্রয়োজন বোঝায়। তাহলে কিভাবে একটি অ্যাপের বক্তৃতা শব্দভান্ডার তাদের সকলের জন্য অনুবাদ করতে পারে?

বিড়ালের জন্য নমনীয় মেশিন লার্নিং

বিনামূল্যে শব্দ ব্যবহার করতে/ আনস্প্ল্যাশ

যদিও কয়েকজন ভার্চুয়াল অ্যাসিস্ট্যান্ট পছন্দ করে অটো স্বর এবং আবেগ বোঝার চেষ্টা, বক্তৃতা স্বীকৃতি এখনও অকথ্য সংকেতগুলিতে ভয়ঙ্কর। কিন্তু তার মানে এই নয় যে তাদের ব্যাখ্যা করা অসম্ভব।

অ্যান্ড্রয়েডের জন্য সেরা ফ্রি অডিওবুক অ্যাপ

MeowTalk এই সমস্যাগুলি কাটিয়ে উঠতে সাহায্য করার জন্য আরও নমনীয় মেশিন লার্নিং ব্যবহার করে।

ডাউনলোড করুন: জন্য MeowTalk অ্যান্ড্রয়েড | আইওএস (বিনামূল্যে)

Meowtalk তৈরি করেছিলেন Javier Sanchez, যিনি Alexa দলেও কাজ করেছিলেন। তিনি অ্যাপটিকে স্মার্ট কলারের দিকে ধাপ হিসেবে কল্পনা করেছিলেন। এই কলারগুলি বিড়ালের শব্দকে মানুষের বক্তব্যে অনুবাদ করবে, জটিল মেশিন লার্নিং কৌশলগুলি আঁকবে যাতে মানুষকে তাদের বিড়ালদের আরও ভালভাবে বুঝতে এবং যত্ন নিতে সাহায্য করতে পারে।

MeowTalk টিম প্রতিটি বিড়ালের জন্য আরো নির্দিষ্ট প্রোফাইল তৈরি করে স্বতন্ত্রতার সমস্যাগুলির জন্য ক্ষতিপূরণ দিয়েছে। অ্যাপে, আপনি প্রতিটি বিড়ালকে আলাদাভাবে নিবন্ধন করেন। বিজ্ঞান নরওয়ে রিপোর্ট করে যে বিড়ালছানাগুলি প্রাপ্তবয়স্ক বিড়ালের চেয়ে আলাদাভাবে মায়ু, তাই অ্যাপটি বিড়ালের জন্মদিনের জন্যও জিজ্ঞাসা করে। প্রতিটি প্রোফাইল বিড়ালের জন্য একটি অনন্য ডেটা নেটওয়ার্ক তৈরি করে, মেশিন লার্নিংয়ে কিছুটা গভীর শিক্ষা অন্তর্ভুক্ত করে।

সম্পর্কিত: ডিপ লার্নিং বনাম মেশিন লার্নিং বনাম এআই: তারা কীভাবে একসাথে যায়?

শব্দভাণ্ডারের জন্য, MeowTalk এর ডেটাসেটে 10 টি সাউন্ড প্রোফাইল দিয়ে শুরু হয়। প্রত্যেকটির একটি আলাদা অর্থ সংযুক্ত আছে, যেমন 'সুখী' বা 'শিকার'। যখন অ্যাপটি একটি শব্দ শোনে এবং এটি ভুল করে, আপনি হয় তা সংশোধন করতে পারেন অথবা একটি নতুন ব্যাখ্যা তৈরি করতে পারেন।

CATSOUNDS ডেটা থেকে সংগ্রহ করা হয়েছে আকভেলন

সংশোধন অ্যাপ্লিকেশনটিকে নতুন শব্দ দিয়ে বেস শব্দভান্ডার প্রতিস্থাপন করতে বলে।

কোন নাম্বার আপনাকে কল করেছে তা কিভাবে খুঁজে বের করতে হয়

উদাহরণস্বরূপ, আপনি লম্বা জোয়ালের পরিবর্তে অ্যাপটিকে বলতে পারেন 'শিকার' ছোট চিপের সাথে মেলে। এই ধরনের সংশোধন একাধিক শব্দ যোগ করার চেয়ে বেশি উপযোগী, যার অর্থ হলো বক্তৃতা স্বীকৃতি, যা অ্যাপকে বলার মতো হবে যে লম্বা জোয়াল এবং ছোট চিৎকার। উভয় মানে 'মা ডাক।'

স্পিচ রিকগনিশন অ্যাপে মেশিন লার্নিং সাধারণত এই ধরনের ওভাররাইটিং প্রতিরোধ করে। এটি সিরিকে শেখানোর চেষ্টা করার মতো হবে যে যখন আপনি 'প্রযুক্তি ব্লগ' বলবেন, তখন আপনি আসলে 'নাশপাতি' বলতে চাচ্ছেন। কিন্তু মেশিন লার্নিংয়ের আরও নমনীয় ফর্ম যা MeowTalk ব্যবহার করে এই সংশোধনটি আরও সহজে পরিচালনা করতে পারে।

একটি নতুন ব্যাখ্যা তৈরি করা একটি অর্থ যোগ করে যা আগে এনকোড করা হয়নি। উদাহরণস্বরূপ, যদি আপনার বিড়ালের একটি নির্দিষ্ট কল থাকে যখন সে তার প্রিয় খেলনা চায়, আপনি একটি বিকল্প হিসাবে 'আমি আমার মাউস চাই' যোগ করতে পারি। এটি আপনার স্বতorস্ফূর্ত অভিধানে একটি শব্দ যোগ করার অনুরূপ।

সম্পর্কিত: অ্যান্ড্রয়েডে আপনার নিজের স্বতorস্ফূর্ত শব্দগুলি কীভাবে সংজ্ঞায়িত করবেন

সময়ের সাথে সাথে, আপনি আপনার বিড়ালের জন্য একটি অত্যন্ত ব্যক্তিগতকৃত বক্তৃতা প্রোফাইল তৈরি করতে পারেন। অবশেষে, এটি এমনকি পোষা প্রাণীদের জন্য উপযোগী হতে বা আচরণগত সমস্যা সমাধানের জন্য যথেষ্ট পরিশীলিত হতে পারে। অন্য কিছু না থাকলে, এটি বিড়াল মালিকদের তাদের পোষা প্রাণীর প্রতি আরও মনোযোগী হতে সহায়তা করে।

রায়: বিড়াল অনুবাদ অ্যাপ্লিকেশন কাজ করে?

শেষ পর্যন্ত, 'বিড়াল অনুবাদ' ব্যবহারকারীকে তাদের বিড়াল কীভাবে কথা বলে তা শেখানোর উপর এখনও অনেকটা নির্ভর করে। প্রতিটি বিড়ালের যোগাযোগ কতটা অনন্য তার জন্য এটি সম্ভবত সবসময়ই হবে।

কিন্তু এই যে মেশিন লার্নিং এতদূর এগিয়ে এসেছে যে ডেভেলপাররা এমনকি আংশিকভাবে সফল হতে পারে এটি অবিশ্বাস্য। মেশিন লার্নিং এবং এআই নিখুঁত গতিতে এগিয়ে যাচ্ছে, এবং তারা পরবর্তী কোথায় যায় তা দেখার জন্য আমরা অপেক্ষা করতে পারি না।

শেয়ার করুন শেয়ার করুন টুইট ইমেইল সম্পর্কিত বিষয়
  • প্রযুক্তি ব্যাখ্যা করা হয়েছে
  • ভাষা শিক্ষা
  • মেশিন লার্নিং
লেখক সম্পর্কে নাটালি স্টুয়ার্ট(47 নিবন্ধ প্রকাশিত)

নাটালি স্টুয়ার্ট MakeUseOf এর একজন লেখক। তিনি প্রথমে কলেজে প্রযুক্তিতে আগ্রহী হন এবং বিশ্ববিদ্যালয়ে মিডিয়া লেখার প্রতি আবেগ তৈরি করেন। নাটালির ফোকাস এমন প্রযুক্তির দিকে যা অ্যাক্সেসযোগ্য এবং ব্যবহার করা সহজ, এবং তিনি এমন অ্যাপ এবং ডিভাইস পছন্দ করেন যা দৈনন্দিন মানুষের জীবনকে সহজ করে তোলে।

নাটালি স্টুয়ার্ট থেকে আরো

আমাদের নিউজলেটার সদস্যতা

প্রযুক্তি টিপস, রিভিউ, ফ্রি ইবুক এবং এক্সক্লুসিভ ডিলের জন্য আমাদের নিউজলেটারে যোগ দিন!

সাবস্ক্রাইব করতে এখানে ক্লিক করুন