পাইথনে ডেটাফ্রেমগুলি কীভাবে মার্জ করবেন তা শিখুন

পাইথনে ডেটাফ্রেমগুলি কীভাবে মার্জ করবেন তা শিখুন

আপনি যদি পাইথন ব্যবহার করেন, এমনকি সহজতম কাজের জন্যও, আপনি সম্ভবত এর তৃতীয় পক্ষের লাইব্রেরির গুরুত্ব সম্পর্কে সচেতন। ডাটাফ্রেমের জন্য চমৎকার সমর্থন সহ পান্ডাস লাইব্রেরি এমনই একটি লাইব্রেরি।





আপনি পাইথন ডেটাফ্রেমে একাধিক ধরণের ফাইল আমদানি করতে পারেন এবং বিভিন্ন ডেটা সেট সংরক্ষণ করতে বিভিন্ন সংস্করণ তৈরি করতে পারেন। একবার আপনি ডেটাফ্রেম ব্যবহার করে আপনার ডেটা আমদানি করলে, আপনি বিস্তারিত বিশ্লেষণ করতে সেগুলিকে একত্রিত করতে পারেন।





মৌলিক বিষয়গুলো মোকাবিলা করা

আপনি মার্জ করা শুরু করার আগে, একত্রিত করার জন্য আপনার ডেটাফ্রেম থাকতে হবে। উন্নয়নের উদ্দেশ্যে, আপনি পরীক্ষা করার জন্য কিছু ডামি ডেটা তৈরি করতে পারেন।





উইন্ডোজ 10 এর জন্য দরকারী ব্যাচ ফাইল

পাইথনে ডেটাফ্রেম তৈরি করুন

প্রথম পদক্ষেপ হিসাবে, আপনার পাইথন ফাইলে পান্ডাস লাইব্রেরি আমদানি করুন। পান্ডাস একটি তৃতীয় পক্ষের লাইব্রেরি যা পাইথনে ডেটাফ্রেম পরিচালনা করে। আপনি ব্যবহার করতে পারেন আমদানি লাইব্রেরি ব্যবহার করার বিবৃতি, নিম্নরূপ:

import pandas as pd

আপনি আপনার কোড রেফারেন্স সংক্ষিপ্ত করতে লাইব্রেরির নামের একটি উপনাম বরাদ্দ করতে পারেন।



আপনাকে অভিধান তৈরি করতে হবে, যা আপনি ডেটাফ্রেমে রূপান্তর করতে পারেন। সেরা ফলাফলের জন্য, দুটি অভিধান ভেরিয়েবল তৈরি করুন- dict1 এবং dict2- তথ্যের নির্দিষ্ট টুকরা সংরক্ষণ করতে:

dict1 = {"user_id": ["001", "002", "003", "004", "005"], 
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}

dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}

মনে রাখবেন, পরবর্তীতে আপনার ডেটাফ্রেমগুলিকে একত্রিত করার জন্য প্রাথমিক কী হিসাবে কাজ করতে আপনার উভয় অভিধানের মানগুলিতে একটি সাধারণ উপাদান থাকতে হবে।





আপনার অভিধানগুলিকে ডেটাফ্রেমে রূপান্তর করুন

আপনার অভিধানের মানগুলিকে ডেটাফ্রেমে রূপান্তর করতে, আপনি নিম্নলিখিত পদ্ধতিটি ব্যবহার করতে পারেন:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

কিছু আইডিই আপনাকে ডেটাফ্রেম ফাংশন উল্লেখ করে এবং টিপে ডেটাফ্রেমের মধ্যে মানগুলি পরীক্ষা করতে দেয় চালান/চালনা করুন . এখানে অনেক পাইথন-সামঞ্জস্যপূর্ণ IDEs , তাই আপনি বাছাই করতে পারেন এবং বেছে নিতে পারেন যেটি শিখতে আপনার জন্য সবচেয়ে সহজ।





  জুপিটার নোটবুক কোড স্নিপেট

একবার আপনি আপনার ডেটাফ্রেমের বিষয়বস্তু নিয়ে সন্তুষ্ট হলে, আপনি মার্জিং ধাপে যেতে পারেন।

মার্জ ফাংশনের সাথে ফ্রেমগুলি একত্রিত করা

মার্জ ফাংশন হল প্রথম পাইথন ফাংশন যা আপনি দুটি ডেটাফ্রেমকে একত্রিত করতে ব্যবহার করতে পারেন। এই ফাংশনটি নিম্নলিখিত ডিফল্ট আর্গুমেন্ট নেয়:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

কোথায়:

  • পিডি পান্ডাস লাইব্রেরির একটি উপনাম।
  • একত্রিত করা ডাটাফ্রেমকে একত্রিত করার ফাংশন।
  • ডেটাফ্রেম 1 এবং ডেটাফ্রেম2 মার্জ করার জন্য দুটি ডেটাফ্রেম।
  • কিভাবে মার্জ টাইপ সংজ্ঞায়িত করে।

কিছু অতিরিক্ত ঐচ্ছিক আর্গুমেন্ট পাওয়া যায়, যেগুলো আপনি ব্যবহার করতে পারেন যখন আপনার একটি জটিল ডেটা স্ট্রাকচার থাকে।

কিভাবে একত্রিতকরণের ধরনটি সংজ্ঞায়িত করা যায় তার জন্য আপনি বিভিন্ন মান ব্যবহার করতে পারেন। এই ধরনের মার্জ আপনার কাছে পরিচিত হলেই হবে ডাটাবেস টেবিলে যোগ দিতে SQL ব্যবহার করা হয়েছে .

বাম মার্জ

বাম মার্জ টাইপ প্রথম ডেটাফ্রেমের মানগুলিকে অক্ষত রাখে এবং দ্বিতীয় ডেটাফ্রেম থেকে মিলিত মানগুলিকে টেনে আনে।

  জুপিটার নোটবুক কোড স্নিপেট

ডান মার্জ

সঠিক মার্জ টাইপ দ্বিতীয় ডেটাফ্রেমের মানগুলিকে অক্ষত রাখে এবং প্রথম ডেটাফ্রেম থেকে মিলিত মানগুলিকে টেনে আনে।

  জুপিটার নোটবুক কোড স্নিপেট

অভ্যন্তরীণ মার্জ

অভ্যন্তরীণ মার্জ টাইপ উভয় ডেটাফ্রেম থেকে মিলে যাওয়া মান ধরে রাখে এবং অ-মেলা মানগুলিকে সরিয়ে দেয়।

টাস্কবার উইন্ডোজ ১০ এ সাড়া দিচ্ছে না
  জুপিটার নোটবুক কোড স্নিপেট

বাইরের মার্জ

বাইরের মার্জ টাইপ সমস্ত মিল এবং অ-ম্যাচিং মান ধরে রাখে এবং ডেটাফ্রেমগুলিকে একত্রিত করে।

  জুপিটার নোটবুক কোড স্নিপেট

কনক্যাট ফাংশনটি কীভাবে ব্যবহার করবেন

দ্য concat ফাংশন পাইথনের অন্যান্য মার্জ ফাংশনের তুলনায় একটি নমনীয় বিকল্প। কনক্যাট ফাংশনের সাহায্যে, আপনি ডেটাফ্রেমগুলি উল্লম্বভাবে এবং অনুভূমিকভাবে একত্রিত করতে পারেন।

যাইহোক, এই ফাংশনটি ব্যবহার করার অসুবিধা হল যে এটি ডিফল্টরূপে কোনো অ-মেলা মান বাতিল করে দেয়। কিছু অন্যান্য সম্পর্কিত ফাংশনের মতো, এই ফাংশনের কয়েকটি আর্গুমেন্ট রয়েছে, যার মধ্যে কয়েকটি সফল সংযোগের জন্য প্রয়োজনীয়।

concat(dataframes, axis=0, join='outer'/inner)

কোথায়:

  • concat ডাটাফ্রেমে যোগদানকারী ফাংশন।
  • ডেটাফ্রেম সংযুক্ত করার জন্য ডেটাফ্রেমের একটি ক্রম।
  • অক্ষ সংযুক্তির দিক নির্দেশ করে, 0 অনুভূমিক, 1 উল্লম্ব।
  • যোগদান একটি বাহ্যিক বা অভ্যন্তরীণ যোগসূত্র নির্দিষ্ট করে।

উপরের দুটি ডেটাফ্রেম ব্যবহার করে, আপনি নিম্নলিখিতভাবে concat ফাংশন চেষ্টা করতে পারেন:

নেটফ্লিক্স এই শিরোনামটি খেলতে আমাদের এখন সমস্যা হচ্ছে
# define the dataframes in a list format 
df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function
print(df_merged_concat)

উপরের কোডে অক্ষ এবং জয়েন আর্গুমেন্টের অনুপস্থিতি দুটি ডেটাসেটকে একত্রিত করে। ম্যাচের অবস্থা নির্বিশেষে ফলাফলের আউটপুটে সমস্ত এন্ট্রি রয়েছে।

একইভাবে, আপনি concat ফাংশনের দিক এবং আউটপুট নিয়ন্ত্রণ করতে অতিরিক্ত আর্গুমেন্ট ব্যবহার করতে পারেন।

সমস্ত মিলে যাওয়া এন্ট্রিগুলির সাথে আউটপুট নিয়ন্ত্রণ করতে:

# Concatenating all matching values between the two dataframes based on their columns 
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')

print(df_merged_concat)

ফলাফল শুধুমাত্র দুটি DataFrames মধ্যে সমস্ত মিল মান রয়েছে.

  জুপিটার নোটবুক কোড স্নিপেট

পাইথনের সাথে ডেটাফ্রেম একত্রিত করা

ডেটাফ্রেমগুলি পাইথনের একটি অবিচ্ছেদ্য অংশ, তাদের নমনীয়তা এবং কার্যকারিতা বিবেচনা করে। তাদের বহুমুখী ব্যবহার প্রদত্ত, আপনি অত্যন্ত স্বাচ্ছন্দ্যের সাথে বিভিন্ন কাজ সম্পাদন করতে তাদের ব্যাপকভাবে ব্যবহার করতে পারেন।

আপনি যদি এখনও পাইথন ডেটাফ্রেম সম্পর্কে শিখছেন, কিছু এক্সেল ফাইল আমদানি করার চেষ্টা করুন, তারপরে সেগুলিকে বিভিন্ন পদ্ধতির সাথে একত্রিত করুন।