বর্গ চিহ্ন, এছাড়াও মিডপয়েন্ট নামে পরিচিত, একটি বর্গ কেন্দ্রে, যা সব মান যে বিষয়শ্রেণীতে অন্তর্ভুক্ত প্রতিনিধিত্ব করে মধ্যে মান। মৌলিকভাবে, শ্রেণি চিহ্নটি নির্দিষ্ট পরামিতিগুলি গণনা করতে ব্যবহৃত হয়, যেমন পাটিগণিত গড় বা স্ট্যান্ডার্ড বিচ্যুতি।
সুতরাং শ্রেণি চিহ্নটি যে কোনও বিরতির মধ্য পয়েন্ট। এই মানটি ইতিমধ্যে শ্রেণিতে বিভক্ত গ্রুপের ডেটাগুলির একটি সেটগুলির বৈকল্পিকগুলি খুঁজে পেতে খুব কার্যকর, যার ফলস্বরূপ আমাদের এই নির্দিষ্ট ডেটাগুলি কেন্দ্র থেকে কত দূরে অবস্থিত তা বুঝতে পারবেন।
কম্পাংক বন্টন
শ্রেণি চিহ্নটি কী তা বোঝার জন্য, ফ্রিকোয়েন্সি বিতরণের ধারণাটি প্রয়োজনীয়। ডেটার একটি সেট দেওয়া, একটি ফ্রিকোয়েন্সি বিতরণ একটি টেবিল যা ডেটাগুলিকে ক্লাস নামে ডাকা অনেকগুলি বিভাগে বিভক্ত করে।
এই টেবিলটি প্রতিটি শ্রেণীর অন্তর্ভুক্ত উপাদানগুলির সংখ্যা দেখায়; দ্বিতীয়টি ফ্রিকোয়েন্সি হিসাবে পরিচিত।
এই টেবিলটি আমরা তথ্য থেকে প্রাপ্ত তথ্যের অংশটিকে ত্যাগ করি, যেহেতু প্রতিটি উপাদানটির স্বতন্ত্র মান না রেখে আমরা কেবল জানি যে এটি class শ্রেণীর অন্তর্গত।
অন্যদিকে, আমরা ডেটা সেট সম্পর্কে আরও ভাল ধারণা অর্জন করি, যেহেতু এইভাবে প্রতিষ্ঠিত নিদর্শনগুলির প্রশংসা করা আরও সহজ, যা বলা তথ্যের ম্যানিপুলেশনকে সহজতর করে।
কত ক্লাস বিবেচনা করতে হবে?
একটি ফ্রিকোয়েন্সি বিতরণ সঞ্চালনের জন্য, আমাদের প্রথমে আমাদের ক্লাসের সংখ্যা নির্ধারণ করতে হবে এবং তাদের শ্রেণি সীমাটি চয়ন করতে হবে।
কয়টি শ্রেণি নেবে সেগুলির পছন্দটি সুবিধামত হওয়া উচিত, এই বিষয়টি বিবেচনায় রেখে যে অল্প সংখ্যক শ্রেণি আমাদের পড়াশোনা করতে চাইছে এমন ডেটা সম্পর্কিত তথ্য গোপন করতে পারে এবং একটি খুব বড় একটি অতিরিক্ত তথ্য জেনারেট করতে পারে যা প্রয়োজনীয়ভাবে কার্যকর নয়।
কতগুলি ক্লাস নেওয়া উচিত তা বেছে নেওয়ার সময় আমাদের যে বিষয়গুলি বিবেচনায় নিতে হবে, তবে এই দুটিয়ের মধ্যেই দাঁড়ানো রয়েছে: প্রথমটি আমাদের বিবেচনা করতে হবে যে কত ডেটা বিবেচনা করতে হবে; দ্বিতীয়টি হ'ল বিতরণের পরিসর কত বড় তা জানতে হবে (এটি বৃহত্তম এবং ক্ষুদ্রতম পর্যবেক্ষণের মধ্যে পার্থক্য)।
ক্লাস ইতিমধ্যে সংজ্ঞায়িত হওয়ার পরে, আমরা প্রতিটি ক্লাসে কতটা ডেটা বিদ্যমান তা গণনা করতে এগিয়ে চলেছি। এই সংখ্যাটিকে ক্লাসের ফ্রিকোয়েন্সি বলা হয় এবং এটি ফাই দ্বারা চিহ্নিত করা হয়।
যেমনটি আমরা আগে বলেছি, আমাদের কাছে রয়েছে যে ফ্রিকোয়েন্সি বিতরণে প্রতিটি তথ্য বা পর্যবেক্ষণ থেকে পৃথকভাবে আসা তথ্য হারাতে থাকে। এই কারণে, এমন একটি মান সন্ধান করা হয়েছে যা পুরো শ্রেণীর সাথে সম্পর্কিত যার প্রতিনিধিত্ব করে; এই মানটি বর্গের চিহ্ন।
এটি কীভাবে প্রাপ্ত হয়?
শ্রেণীর চিহ্ন হ'ল মূল মান যা একটি শ্রেণি প্রতিনিধিত্ব করে। এটি অন্তরের সীমা যুক্ত করে এবং এই মানটিকে দুটি দ্বারা ভাগ করে প্রাপ্ত হয়। আমরা নিম্নলিখিত হিসাবে এই গাণিতিকভাবে প্রকাশ করতে পারে:
x i = (নিম্ন সীমা + উচ্চতর সীমা) / 2।
এই অভিব্যক্তিটিতে x আমি ith শ্রেণীর চিহ্নকে বোঝায়।
উদাহরণ
নিম্নলিখিত ডেটা সেটটি দেওয়া, একটি প্রতিনিধি ফ্রিকোয়েন্সি বিতরণ দিন এবং সংশ্লিষ্ট শ্রেণীর চিহ্ন পান।
যেহেতু সর্বাধিক সংখ্যাসূচক মানের ডেটা 391 এবং সর্বনিম্ন 221, তাই আমাদের কাছে পরিসীমা 391 -221 = 170।
আমরা 5 টি ক্লাস বেছে নেব, সমস্ত একই আকারের। ক্লাসগুলি বেছে নেওয়ার একটি উপায় নিম্নরূপ:
নোট করুন যে প্রতিটি ডেটা একটি শ্রেণিতে রয়েছে, এগুলি অসম্পূর্ণ এবং একই মান রয়েছে। ক্লাস বাছাই করার আরেকটি উপায় হ'ল ডেটাটিকে অবিচ্ছিন্ন পরিবর্তনশীল হিসাবে বিবেচনা করা, যা কোনও আসল মান পর্যন্ত পৌঁছতে পারে। এই ক্ষেত্রে আমরা ফর্মের ক্লাসগুলি বিবেচনা করতে পারি:
205-245, 245-285, 285-325, 325-365, 365-405
যাইহোক, ডেটা গোষ্ঠীকরণের এই পদ্ধতিটি সীমানার সাথে কিছু অস্পষ্টতা উপস্থাপন করতে পারে। উদাহরণস্বরূপ, 245 এর ক্ষেত্রে, প্রশ্ন উত্থাপিত হয়: এটি কোন শ্রেণীর সাথে সম্পর্কিত, প্রথম বা দ্বিতীয়?
এই বিভ্রান্তি এড়াতে, একটি শেষ পয়েন্ট কনভেনশন করা হয়। এইভাবে, প্রথম শ্রেণিটি হবে বিরতি (205,245], দ্বিতীয় (245,285], ইত্যাদি।
ক্লাসগুলি সংজ্ঞায়িত হয়ে গেলে, আমরা ফ্রিকোয়েন্সি গণনা করতে এগিয়ে যাই এবং আমাদের নীচের সারণী থাকে:
ডেটাটির ফ্রিকোয়েন্সি বিতরণ পাওয়ার পরে, আমরা প্রতিটি বিরতির ক্লাস চিহ্নগুলি সন্ধান করতে এগিয়ে যাই। কার্যত, আমাদের করতে হবে:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
আমরা নিম্নলিখিত গ্রাফ দ্বারা এটি প্রতিনিধিত্ব করতে পারেন:
এটি কিসের জন্যে?
পূর্বে উল্লিখিত হিসাবে, গাণিতিক গড় এবং ইতিমধ্যে বিভিন্ন শ্রেণিতে বিভক্ত করা হয়েছে এমন একটি ডেটা গ্রুপের বৈচিত্র জানতে শ্রেণীর চিহ্নটি খুব কার্যকরী।
নমুনা আকারের মধ্যে প্রাপ্ত পর্যবেক্ষণের যোগফল হিসাবে আমরা পাটিগণিত গড়কে সংজ্ঞায়িত করতে পারি। দৈহিক দৃষ্টিকোণ থেকে, এর ব্যাখ্যাটি কোনও ডেটা সেটের ভারসাম্য বিন্দুর মতো।
একটি একক সংখ্যা দ্বারা সেট করা একটি সম্পূর্ণ ডেটা সনাক্তকরণ ঝুঁকিপূর্ণ হতে পারে, সুতরাং এই ব্রেকিংভেন পয়েন্ট এবং প্রকৃত ডেটার মধ্যে পার্থক্যটিও বিবেচনায় নেওয়া উচিত। এই মানগুলি গাণিতিক গড় থেকে বিচ্যুতি হিসাবে পরিচিত, এবং এগুলির সাহায্যে আমরা ডেটাগুলির গাণিতিক গড়ের পরিমাণ কতটা পৃথক হয় তা নির্ধারণ করতে চাই।
এই মানটি সন্ধান করার সর্বাধিক সাধারণ উপায়টি হ'ল বৈচিত্র্য দ্বারা, এটি পাটিগণিত গড় থেকে বিচ্যুতির স্কোয়ারের গড়।
পাটিগণিত গড় এবং একটি শ্রেণিতে গোষ্ঠীভুক্ত ডেটার সংকলনের বৈকল্পিক গণনা করতে আমরা নিম্নলিখিত সূত্রগুলি যথাক্রমে ব্যবহার করি:
এই এক্সপ্রেশনগুলিতে x i হ'ল I-th শ্রেণি চিহ্ন, f আমি সংশ্লিষ্ট ফ্রিকোয়েন্সি এবং k শ্রেণীর সংখ্যা যেখানে ডেটা বিভক্ত করা হয়েছে তার প্রতিনিধিত্ব করে।
উদাহরণ
পূর্ববর্তী উদাহরণে প্রদত্ত ডেটা ব্যবহার করে, আমাদের কাছে আমরা ফ্রিকোয়েন্সি বিতরণ সারণির আরও কিছুটা ডেটা প্রসারিত করতে পারি। আপনি নিম্নলিখিত পেতে:
তারপরে, সূত্রে ডেটা স্থাপন করে, আমরা গাণিতিক গড়টি এইভাবে রেখে যাব:
এর বৈকল্পিকতা এবং মানক বিচ্যুতি হ'ল:
এ থেকে আমরা উপসংহারে আসতে পারি যে মূল ডেটাগুলিতে 306.6 এর পাটিগণিত গড় এবং 39.56 এর একটি মানক বিচ্যুতি রয়েছে।
তথ্যসূত্র
- ফার্নান্দেজ এফ সান্টিয়াগো, কর্ডোবা এল আলেজান্দ্রো, করর্ডো এস হোসে এম। বর্ণনামূলক পরিসংখ্যান। এসিক সম্পাদকীয়।
- ঝনসন রিচার্ড এ। মিলার এবং ফ্রেন্ড সম্ভাব্যতা এবং ইঞ্জিনিয়ারদের জন্য স্টেটসম্যানস.পিয়ারসন এডুকেশন।
- মিলার I এবং ফ্রেন্ড জে। সম্ভাব্যতা এবং প্রকৌশলীদের জন্য স্টেটসম্যান। প্রত্যাবর্তন করে।
- সরবিয়া এ জোস মারিয়া, প্যাসকুল মার্তা। সংস্থাগুলির জন্য বেসিক পরিসংখ্যান কোর্স
- লিলিন্স এস হাম্বার্তো, রোজাস এ কার্লোস বর্ণনামূলক পরিসংখ্যান এবং সম্ভাব্যতা বিতরণ, ইউনিভার্সিডেড ডেল নর্ট সম্পাদকীয়