- সমজাতীয়ত্বের গুরুত্ব
- হোমোসেসডেস্টিটি বনাম হেটেরোসেসটেস্টিটি
- সমকামিতা পরীক্ষা
- মানকযুক্ত ভেরিয়েবল
- সমকামিতার অ-গ্রাফিকাল পরীক্ষা
- তথ্যসূত্র
Homoscedasticity একটি ভবিষ্যদ্বাণীপূর্ণ পরিসংখ্যান মডেল ঘটে যদি সব এক বা একাধিক পর্যবেক্ষণ, ভ্যারিয়েন্স (অথবা স্বাধীন) প্যাটার্ন ডাটা গ্রুপ সঙ্গে ব্যাখ্যামূলক ভেরিয়েবল থেকে সম্মান ধ্রুবক থাকা।
একটি রিগ্রেশন মডেল সমকামী হতে পারে বা নাও হতে পারে, এক্ষেত্রে আমরা হিটারোসেসডাস্টিকটির কথা বলি।
চিত্র 1. সেটটির পাঁচটি ডেটা সেট এবং রিগ্রেশন ফিট। পূর্বাভাসিত মানের ক্ষেত্রে প্রকরণটি প্রতিটি গ্রুপে একই রকম। (Upav-biblioteca.org)
একাধিক স্বতন্ত্র ভেরিয়েবলের একটি পরিসংখ্যানগত রিগ্রেশন মডেলকে হোমোসেসডেস্টিক বলা হয়, কেবলমাত্র যদি ভবিষ্যদ্বাণীযুক্ত ভেরিয়েবলের ত্রুটির ভিন্নতা (বা নির্ভরশীল ভেরিয়েবলের স্ট্যান্ডার্ড বিচ্যুতি) ব্যাখ্যাযোগ্য বা স্বতন্ত্র ভেরিয়েবলের মানগুলির বিভিন্ন গোষ্ঠীর জন্য অভিন্ন থাকে।
চিত্র ১-এর পাঁচটি ডেটা গ্রুপে, প্রতিটি গ্রুপের বৈচিত্র্য গণনা করা হয়েছে, প্রতিরোধের দ্বারা অনুমান করা মানের প্রতি, প্রতিটি গ্রুপে একই হতে পারে। এটি আরও ধরে নেওয়া হয় যে ডেটাগুলি সাধারণ বিতরণ অনুসরণ করে।
গ্রাফিক্যাল স্তরে এটির অর্থ হ'ল পয়েন্টগুলি সমানভাবে ছড়িয়ে ছিটিয়ে বা ছড়িয়ে ছিটিয়ে থাকে যা রিগ্রেশন ফিটের দ্বারা পূর্বাভাসিত মানটির চারপাশে থাকে এবং রেগ্রেশন মডেলের ব্যাখ্যামূলক ভেরিয়েবলের পরিসরের জন্য একই ত্রুটি এবং বৈধতা থাকে।
সমজাতীয়ত্বের গুরুত্ব
ভবিষ্যদ্বাণীমূলক পরিসংখ্যানগুলিতে সমকামিতার গুরুত্ব চিত্রিত করার জন্য, বিপরীত ঘটনা, ভিন্নধর্মের সাথে বৈপরীত্য হওয়া প্রয়োজন।
হোমোসেসডেস্টিটি বনাম হেটেরোসেসটেস্টিটি
চিত্র 1 এর ক্ষেত্রে, যেখানে সমকামিতা রয়েছে, এটি সত্য যে:
বর্ণ ((y1-Y1); এক্স 1) ≈ ভার ((y2-Y2); এক্স 2) ≈ …… ভার ((y4-Y4); এক্স 4)
যেখানে Var ((yi-Yi); Xi) তারতম্যকে প্রতিনিধিত্ব করে, জোড়া (xi, yi) গ্রুপ i এর ডেটা উপস্থাপন করে, যখন Yi গ্রুপটির গড় মান XI এর জন্য রিগ্রেশন দ্বারা পূর্বাভাসিত মান। গ্রুপ i থেকে n এর তথ্যের বৈকল্পিকটি নীচে গণনা করা হচ্ছে:
বর্ণ ((ইয়ি-ইআই); শি) = জে (ইজি - ইই) ^ 2 / এন
বিপরীতে, যখন হেটেরোসেসটেস্টিটিটি দেখা দেয়, তখন রিগ্রেশন মডেল পুরো অঞ্চলটির জন্য বৈধ হতে পারে না যেখানে এটি গণনা করা হয়েছিল। চিত্র 2 এই পরিস্থিতির একটি উদাহরণ দেখায়।
চিত্র 2. ভিন্ন ভিন্ন উপাত্ত দেখায় এমন গোষ্ঠীর ডেটা। (নিজস্ব বিবরণ)
চিত্র 2 একটি লিনিয়ার রিগ্রেশন ব্যবহার করে তিনটি উপাত্তের ডেটা এবং সেটের ফিটকে উপস্থাপন করে। এটি লক্ষ করা উচিত যে দ্বিতীয় এবং তৃতীয় গ্রুপগুলির ডেটা প্রথম গ্রুপের তুলনায় বেশি ছড়িয়ে পড়ে। চিত্র 2 এর গ্রাফটি প্রতিটি গ্রুপের ডেটা প্রতিটি গ্রুপের স্ট্যান্ডার্ড বিচ্যুতি সহ প্রতিটি গ্রুপের গড় মূল্য এবং ত্রুটি বার ± shows দেখায়। এটি মনে রাখা উচিত যে স্ট্যান্ডার্ড বিচ্যুতি the বৈকল্পিকের বর্গমূল।
এটি স্পষ্ট যে ভিন্ন ভিন্নতার ক্ষেত্রে, সংক্ষিপ্ত বিবরণী ত্রুটি বর্ণনাকারী বা স্বতন্ত্র ভেরিয়েবলের মানগুলির পরিসীমাতে পরিবর্তিত হচ্ছে এবং বিরতি যেখানে এই ত্রুটিটি খুব বড় সেখানে রিগ্রেশন পূর্বাভাস অবিশ্বাস্য বা প্রযোজ্য নয়।
একটি রিগ্রেশন মডেলে ত্রুটি বা অবশিষ্টাংশ (এবং -Y) স্বাধীন ভেরিয়েবলের মানগুলির ব্যবধানের মধ্যে সমান বৈচিত্র (var ^ 2) দিয়ে বিতরণ করতে হবে। এই কারণেই একটি ভাল রিগ্রেশন মডেল (লিনিয়ার বা ননলাইনার) অবশ্যই হোমোসেসেডাস্টিটি পরীক্ষায় উত্তীর্ণ হতে হবে।
সমকামিতা পরীক্ষা
চিত্র 3 এ দেখানো পয়েন্টগুলি একটি সমীক্ষার তথ্যের সাথে সামঞ্জস্যপূর্ণ যা বর্গ মিটারের আকার বা ক্ষেত্রের ফাংশন হিসাবে বাড়ির দামের (ডলারে) মধ্যে সম্পর্কের সন্ধান করে।
পরীক্ষিত প্রথম মডেলটি হ'ল লিনিয়ার রিগ্রেশন। প্রথমত, এটি লক্ষণীয় যে ফিটের আর determination 2 এর সংকল্পের সহগ যথেষ্ট উচ্চ (91%), তাই এটি ভাবা যায় যে ফিটটি সন্তোষজনক।
তবে সমন্বয় গ্রাফ থেকে দুটি অঞ্চল পরিষ্কারভাবে আলাদা করা যায়। এর মধ্যে একটি, ডানদিকে ডিম্বাকৃতিতে আবদ্ধ, সমকামিতা পূর্ণ করে, অন্যদিকে বাম অঞ্চলে সমকামিতা নেই।
এর অর্থ হ'ল 1800 মি ^ 2 থেকে 4800 মি ^ 2 অবধি রিগ্রেশন মডেলের পূর্বাভাস যথেষ্ট এবং নির্ভরযোগ্য তবে এই অঞ্চলের বাইরে খুব অপ্রতুল। হেটেরোসেসটেস্টিক জোনে, ত্রুটিটি কেবল খুব বড় নয়, লিনিয়ার রিগ্রেশন মডেল দ্বারা প্রস্তাবিত তথ্যের চেয়েও ডেটা পৃথক প্রবণতা অনুসরণ করে বলে মনে হয়।
চিত্র 3. আবাসিক দাম বনাম অঞ্চল এবং লিনিয়ার রিগ্রেশন দ্বারা ভবিষ্যদ্বাণীপূর্ণ মডেল, সমকামিতা এবং ভিন্ন ভিন্ন অঞ্চল প্রদর্শন করে। (নিজস্ব বিবরণ)
তথ্যের বিচ্ছুরণ প্লটটি তাদের সমকামিতার সহজতম এবং ভিজ্যুয়াল পরীক্ষা, তবে এমন ঘটনাগুলিতে যেখানে চিত্র 3-এ দেখানো উদাহরণের মতো স্পষ্ট নয়, সেখানে সহায়ক ভেরিয়েবলগুলি সহ গ্রাফগুলি অবলম্বন করা প্রয়োজন।
মানকযুক্ত ভেরিয়েবল
যে অঞ্চলগুলিতে সমকামিতা পূর্ণ হয় এবং যেখানে তা হয় না সেগুলি পৃথক করার জন্য মানকযুক্ত ভেরিয়েবল জেডআর এবং জেডপ্রেড চালু করা হয়েছে:
জেডআরস = অ্যাবস (ওয়াই - ওয়াই) / σ
জেডপ্রেড = ওয়াই / σ
এটি লক্ষ করা উচিত যে এই পরিবর্তনগুলি প্রয়োগিত রিগ্রেশন মডেলের উপর নির্ভর করে, যেহেতু Y রিগ্রেশন পূর্বাভাসের মান। নীচে একই উদাহরণের জন্য স্ক্রেটার প্লট জেড্রেস বনাম জেডপ্রেড রয়েছে:
চিত্র ৪. এটি লক্ষ করা উচিত যে হোমোসেসডেস্টিটিটি জোনে জেডআরস পূর্বাভাস অঞ্চলে একচেটিয়া এবং ছোট থাকে (নিজস্ব বিস্তৃতি)।
স্ট্যান্ডার্ডযুক্ত ভেরিয়েবলগুলি সহ চিত্র 4-এর গ্রাফের মধ্যে, অবশিষ্টাংশ ত্রুটিযুক্ত এবং ইউনিফর্ম যেখানে রয়েছে সে অঞ্চলটি পরিষ্কারভাবে পৃথক করা হয়েছে it প্রথম জোনে, সমকামিতা পূর্ণ হয়, যখন অঞ্চলে যেখানে অবশিষ্টাংশ ত্রুটি অত্যন্ত পরিবর্তনশীল এবং বৃহত হয়, সেখানে ভিন্ন ভিন্নতা পূর্ণ হয়।
রিগ্রেশন সমন্বয়টি চিত্র 3 এ একই গ্রুপের ডেটাতে প্রয়োগ করা হয়, এক্ষেত্রে সামঞ্জস্যটি অ-রৈখিক হয়, যেহেতু ব্যবহৃত মডেলটি একটি সম্ভাব্য ফাংশন জড়িত। ফলাফলটি নিম্নলিখিত চিত্রটিতে দেখানো হয়েছে:
চিত্র 5. একটি অ-রৈখিক রিগ্রেশন মডেল সহ ডেটা ফিটিংয়ে হোমোসেসডেস্টিটি এবং হিটারোসেসডাস্টিকটির নতুন জোন। (নিজস্ব বিবরণ)
চিত্র 5 এর গ্রাফে, সমকামী এবং ভিন্ন ভিন্ন অঞ্চলগুলি স্পষ্টভাবে লক্ষ করা উচিত। এটিও লক্ষ করা উচিত যে এই অঞ্চলগুলি লিনিয়ার ফিটের মডেলটিতে গঠিত তাদের সম্মানের সাথে বিনিময় করা হয়েছিল।
চিত্র 5 এর গ্রাফে এটি স্পষ্ট যে ফিটের স্থিরতা (93.5%) মোটামুটি উচ্চতর সহগের পরেও, বর্ণনামূলক ভেরিয়েবলের পুরো ব্যবধানের জন্য মডেল পর্যাপ্ত নয়, যেহেতু মানগুলির জন্য ডেটা 2000 মি ^ 2 এর চেয়ে বেশি উপস্থিত ভিন্ন ভিন্ন।
সমকামিতার অ-গ্রাফিকাল পরীক্ষা
হোমোসিডাস্টিকটি পূরণ হয়েছে কিনা তা যাচাই করতে সবচেয়ে বেশি ব্যবহৃত অ গ্রাফিকাল পরীক্ষার মধ্যে একটি ব্রুশ-পৌত্তলিক পরীক্ষা।
এই পরীক্ষার সমস্ত বিবরণ এই নিবন্ধে দেওয়া হবে না, তবে এর মৌলিক বৈশিষ্ট্য এবং এর পদক্ষেপগুলি মোটামুটি উল্লিখিত হয়েছে:
- রিগ্রেশন মডেলটি এন ডেটাতে প্রয়োগ করা হয় এবং মডেল estimated ^ 2 = ∑j (yj - Y) ^ 2 / n দ্বারা মূল্যমানের সাথে সম্মতি অনুসারে এর বৈকল্পিক গণনা করা হয়।
- একটি নতুন ভেরিয়েবল সংজ্ঞায়িত ε = ((yj - Y) ^ 2) / (σ ^ 2)
- একই রিগ্রেশন মডেলটি নতুন ভেরিয়েবলে প্রয়োগ করা হয় এবং এর নতুন রিগ্রেশন পরামিতি গণনা করা হয়।
- সমালোচনামূলক মান চি বর্গ (χ ^ 2) নির্ধারিত হয়, এটি ভেরিয়েবল in এর নতুন অবশিষ্টাংশগুলির যোগফলের অর্ধেক being
- চি বর্গ বিতরণ টেবিলটির সারণীর x অক্ষের তাত্পর্য (সাধারণত 5%) এবং স্বাধীনতার ডিগ্রির সংখ্যা (ইউনিট বিয়োগের ইউনিট বিয়োগের #) বিবেচনা করে ব্যবহৃত হয়, মানটির জন্য বোর্ড.
- পদক্ষেপ 3 এ প্রাপ্ত সমালোচনামূলক মানটি সারণীতে পাওয়া মানের সাথে তুলনা করা হয় (χ ^ 2)।
- সমালোচনামূলক মানটি যদি টেবিলের নীচে হয় তবে আমাদের নাল অনুমান আছে: সমকামিতা রয়েছে
- সমালোচনামূলক মানটি যদি টেবিলের চেয়ে উপরে হয় তবে আমাদের কাছে বিকল্প অনুমান আছে: কোনও সমকামিতা নেই।
বেশিরভাগ পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার প্যাকেজ যেমন: এসপিএসএস, মিনিট্যাব, আর, পাইথন পান্ডাস, এসএএস, স্ট্যাটগ্রাফিক এবং আরও বেশ কয়েকটি ব্রুশ-পৌত্তলিক হোমোসেসডাস্টিটি পরীক্ষা অন্তর্ভুক্ত করে। বৈচিত্রের অভিন্নতা যাচাই করার জন্য আরেকটি পরীক্ষা হ'ল লেভেন পরীক্ষা।
তথ্যসূত্র
- বক্স, হান্টার এবং হান্টার (1988) গবেষকদের জন্য পরিসংখ্যান। আমি সম্পাদকদের বিপরীত।
- জনস্টন, জে (1989)। একনোমেট্রিক্স পদ্ধতি, ভিসেন্স-সম্পাদনা করে।
- মুরিলো এবং গঞ্জালেজ (2000)। একনোমেট্রিক্স ম্যানুয়াল। লাস পালমাস ডি গ্রান ক্যানেরিয়া বিশ্ববিদ্যালয়। থেকে উদ্ধার করা হয়েছে: ulpgc.es।
- উইকিপিডিয়া। Homoscedasticity। পুনরুদ্ধার করা হয়েছে: es.wikedia.com.com থেকে
- উইকিপিডিয়া। Homoscedasticity। পুনরুদ্ধার করা হয়েছে: en.wikedia.com থেকে ipedia