কেন আমাদের আরো দৃশ্যমানতা প্রয়োজন সোশ্যাল মিডিয়া অ্যানালিটিক্স আলগোরিদিম আমরা ব্যবহার

কেন আমাদের আরো দৃশ্যমানতা প্রয়োজন সোশ্যাল মিডিয়া অ্যানালিটিক্স আলগোরিদিম আমরা ব্যবহার

সামাজিক প্রচার মাধ্যম ক্রমবর্ধমানভাবে পরিণত হয়েছে, যার মাধ্যমে আমরা আধুনিক মানব বিশ্বকে পর্যবেক্ষণ করছি । পালাক্রমে, সামাজিক মিডিয়া বিশ্লেষণ প্ল্যাটফর্মের সুবিশাল শিল্প এমন একটি যন্ত্র হয়ে উঠেছে যার মাধ্যমে আমরা সমাজের ধারণা তৈরি করার জন্য লেন্স ব্যবহার করি । তারপরেও, বাস্তব বিশ্ব ব্যবসা এবং সরকারী সিদ্ধান্ত তাদের ফলাফলের উপর তৈরি করা সত্ত্বেও, আমরা এই প্ল্যাটফর্মের অধিকাংশ আলগোরিদিম সম্পর্কে আশ্চর্যজনক সামান্য জানি, বিশেষ করে তাদের প্রান্ত ঘটনা এবং ইংতের্প্রেটতিবে তারতম্য. আমরা কোন কিছুই জানি অ্যালগোরিদমের ফলাফলের উপর ভিত্তি করে সামাজিক মিডিয়া সম্পর্কে কিভাবে অর্থপূর্ণ সিদ্ধান্ত নিতে পারি?

প্রায় প্রতিটি সামাজিক মিডিয়া বিশ্লেষণ প্ল্যাটফর্ম আজ আবেগ বিশ্লেষণ কিছু ফর্ম উপলব্ধ করা হয়, সাধারণত একটি সহজ ইতিবাচক-নিরপেক্ষ-নেতিবাচক স্কোর, কিন্তু মাঝে মাঝে আনন্দ বা ভয় মত কিছু অতিরিক্ত আরো সূক্ষ্ম বিভাগ.

এই আবেগ স্কোর সামাজিক প্রবণতা বোঝার জন্য একটি গো-সম্পদ হয়ে উঠেছে, বিষয় সম্পর্কে প্রতিক্রিয়া এবং কাজ ব্যবসা এবং বিপণন সিদ্ধান্ত সাহায্য.

সামাজিক মিডিয়ার আবেগকে গণনা করা অত্যন্ত কঠিন কাজ, জটিলতাগুলো ভরা ।

দুর্ভাগ্যবশত, কিছু সামাজিক মিডিয়া কোম্পানি তাদের আবেগকে আলগোরিদিম কিভাবে কাজ করে, তাদের মালিকানা ব্যবসার গোপন হিসাবে তাদের চিকিত্সা কিভাবে কোনো বিস্তারিত প্রযুক্তিগত বিস্তারিত প্রস্তাব.

কিছু প্রকাশ করে যে তাদের সিস্টেম প্রথাগত সহজ "শব্দের ব্যাগ" শব্দ কাউন্টারে যে কেবল শব্দ দুটি তালিকা আছে, একটি "ইতিবাচক" শব্দ এবং একটি "নেতিবাচক" শব্দ জন্য এবং মাত্র গণনা আপ কিভাবে একটি টুইটের শব্দ প্রতিটি তালিকায় আছে. কিছু প্রতিটি শব্দ রেকর্ডিং একটি স্কোর যোগ শুধু কিভাবে "ইতিবাচক" বা "নেতিবাচক" এটি হয়, "প্রেম" এবং "লাইক" বা "লোঠে" এবং "অপছন্দ" মধ্যে পার্থক্য. কিছু ব্যবহার আরো অত্যাধুনিক পরিসংখ্যানগত বা এমনকি স্নায়ুবিক আলগোরিদিম. যাহোক, প্রায় কেউ তাদের প্রকৃত শব্দ তালিকা বা আলগোরিদিম ভাগ.

আবেগ আলগোরিদিম মধ্যে অপূর্ণাঙ্গ দৃশ্যমানতা শুধুমাত্র নেতিবাচক বা ইতিবাচক টুইট ফিল্টারিং দ্বারা পাওয়া যেতে পারে এবং তারপর শব্দ ক্লাউড হিস্টোগ্রাম বৈশিষ্ট্য ব্যবহার করে অধিকাংশ প্ল্যাটফর্মের দ্বারা প্রদত্ত এই টুইটগুলো আয়ত্ত করার জন্য বলে মনে হয় । এটি বিশেষভাবে শব্দভাণ্ডার সমৃদ্ধকারীগুলির জন্য চিহ্নিত করতে সহায়তা করতে পারে ।

উদাহরণস্বরূপ, একটি টুল ধারাবাহিকভাবে বাস্কেটবল টুইটগুলোতে আরো বেশি নেতিবাচক হয়ে উঠেছে । অপরাধী এই সত্য যে এই নমুনা অনেক বাস্কেটবল টুইট বাস্কেটবল আদালতে উল্লেখ করার জন্য "কোর্ট" শব্দ অন্তর্ভুক্ত করা হয়েছে, যখন সরঞ্জামের আবেগ অভিধান একটি অত্যন্ত নেতিবাচক শব্দ হিসেবে "কোর্ট" লেবেল, এটি সবসময় একটি আইনি আদালতে উল্লেখ করা হয়.

একইভাবে, অন্য একটি বিশ্লেষণে দেখা যায় রিপাবলিকানদের সম্পর্কে অনেক বেশি ইতিবাচক হতে থাকা ডেমোক্র্যাট সম্পর্কে, কারণ নমুনা সময়ের মধ্যে ডেমোক্রেটদের প্রায়ই কেবল "ডেমোক্র্যাট" বলে উল্লেখ করা হয়েছে, যদিও রিপাবলিকানরা ধারাবাহিকভাবে " রিপাবলিকান পার্টি । " একটি খুব ইতিবাচক শব্দ হিসাবে অ্যালগরিদম দ্বারা "পার্টি" শব্দটি ভুলভাবে লেবেল করা হয়েছিল ।

এই ফ্যাশনে রিভার্স ইঞ্জিনিয়ারিং মনোভাব আলগোরিদিম অ্যালগরিদম এর অভিধান মধ্যে মিশালীগ্ন্মেংত্স সনাক্ত এবং নির্দিষ্ট ডোমেইন পরীক্ষা করা হচ্ছে সাহায্য করতে পারেন. কিছু সামাজিক বিশ্লেষণ প্লাটফর্ম তাদের ব্যবহারকারীকে ম্যানুয়ালি একটি প্রদত্ত বিশ্লেষণে প্রয়োগ করা আবেগকে অভিধান সামঞ্জস্য করার অনুমতি দেয়, ডোমেইন অভিযোজন সমর্থন করে, যদিও সব না । এই ধরনের অ্যালগরিদমিক বিশ্লেষণ এছাড়াও তার অভিধানের প্রোভেনশনের মতো সংকেত দিতে পারে, কিছু প্ল্যাটফর্মের সঙ্গে হালকা পরিবর্তন ভাল পরিচিত ওপেন সোর্স আবেগকে অভিধান ব্যবহার করে ।

কিছু কিছু সংকেত তাদের আভ্যন্তরীণ ব্যবহারকারীর ডকুমেন্টেশন প্রদান করে, যেমন উল্লেখ করা হয়েছে যে তাদের আবেগকে সিস্টেম প্রাথমিকভাবে কয়েক লক্ষ বা কয়েক মিলিয়ন টুইটে প্রশিক্ষণ দেয় যখন কোম্পানী প্রথম পাওয়া যায় এবং এর পর থেকে আপডেট করা হয় না । আসলে টুইটারের সাম্প্রতিক ভাষাগত তারতম্য ক্যাপচার করতে কয়েক ঘন্টার মধ্যে তাদের অভিধান আপডেট করা হয় ।

এক দশক আগে থেকে কয়েক মিলিয়ন টুইটের উপর ভিত্তি করে একটি অভিধান ব্যবহার করা হয়েছে, যা আসলে ঐ ফলাফল পরিমাপ করা নিয়ে মারাত্মক উদ্বেগের সৃষ্টি করে ।

বেশীরভাগ স্যোশাল মিডিয়া অ্যানালিটিক্স প্লাটফর্ম ব্যবহারকারীরা ডেটা বিজ্ঞানীদের নয়, মানে তারা সম্ভবত এই ধরনের প্রশ্ন বা তাদের প্রাপ্ত ফলাফলের পদ্ধতিগত মূল্যায়ন নিয়ে সমালোচনামূলক চিন্তা করে না ।

ভাষা সনাক্তকরণ অন্য একটি অস্বচ্ছ কিন্তু গুরুত্বপূর্ণ অ্যালগরিদম বিভিন্ন ভাষায় বিভিন্ন অর্থ আছে বা যা এক ভাষায় একটি ব্র্যান্ড নাম প্রতিনিধিত্ব করে, অন্য একটি সাধারণ অসম্পর্কহীন শব্দ, কিন্তু একটি ভাষা অনুসন্ধান ।

প্রথম দর্শনেই এটি একটি প্রদত্ত টুইটের ভাষা নির্ধারণে তুলনামূলক তুচ্ছ বলে মনে হতে পারে । যাইহোক, অকরনযম্স এবং অপভাষার পরিভাষা সামান্য পরিমাণ লেখা এবং প্রাদুর্ভাব সামাজিক মিডিয়া কন্টেন্ট বিশেষত ঐতিহ্যগত ভাষা সনাক্তকরণ আলগোরিদিম জন্য কঠিন করে তোলে. গুগল ক্রোম ল্যাঙ্গুয়েজ ডিটেকশন (CLD2) লাইব্রেরির মত টুলস সহজেই বেশ ব্যবহারযোগ্য ফলাফলের সাথে প্রয়োগ করা যেতে পারে, কিন্তু অনেক বিশ্লেষণ প্লাটফর্ম তাদের নিজের পছন্দসই অ্যালগরিদম স্থাপন করে যা সামাজিক ব্যবহারের জন্য অপ্টিমাইজ করা হয়েছে, বিশেষ করে টুইটারের মাধ্যমে ।

CLD2 মত ব্যাপকভাবে ব্যবহৃত লাইব্রেরি ভাল কর্মক্ষমতা বৈশিষ্ট্য এবং তাদের প্রান্ত ক্ষেত্রে ব্যাপক ডকুমেন্টেশন বোঝা আছে. কিছু, CLD2 মত, সম্পূর্ণ ওপেন সোর্স, উন্নত ব্যবহারকারীদের সম্পূর্ণরূপে বুঝতে কিভাবে অ্যালগরিদম তার নির্ধারকরা আসে এবং সক্রিয় পরিবেশ যেখানে এটি সংগ্রাম করতে পারে সনাক্ত করার অনুমতি দেয় ।

বিপরীতে, কিছু সামাজিক মিডিয়া বিশ্লেষণ সংস্থাগুলো তাদের মালিকানাধীন ভাষা সনাক্তকরণ সিস্টেম ডকুমেন্টেশন উপায়ে অনেক প্রদান. অনেক পতন নির্দিষ্ট প্রযুক্তিগত প্রশ্নের উত্তর, যার মধ্যে অ্যালগরিদম টাইপ এবং তার প্রশিক্ষণ তথ্য উৎপত্তি, যেমন তথ্য মালিকানা ব্যবসায়িক তথ্য হিসাবে চিকিত্সা.

আবেগ অনুরূপ, এটা কখনও কখনো একটি প্রদত্ত কোম্পানীর "মালিকানা" অ্যালগরিদম বাস্তবে একটি প্রমিত লাইব্রেরি যেমন CLD2 যেমন হাইপারলিঙ্কের এবং @username রেফারেন্স অপসারণ মত কয়েকটি মৌলিক সাধারণ সূত্র প্রাকপ্রক্রিয়াকরণ পদক্ষেপ ।

বেশিরভাগ সময়, যাহোক, এটি একটি কোম্পানীর ভাষা সনাক্তকরণ অ্যালগরিদম ফাংশন কিভাবে জানা অসম্ভব.

তার তারতম্য এবং প্রান্ত ক্ষেত্রে কোনো বোঝার ছাড়া একটি তৃতীয় পক্ষের অ্যালগরিদম উপর নির্ভর যখন এটি ফলাফল এটি উৎপাদনের ব্যাখ্যা আসে অত্যন্ত বিপজ্জনক. যদি কোন বিশ্লেষণমূলক প্লাটফর্ম রিপোর্ট করে যে ডাচ টুইট একটি বিষয় প্রায় শূন্য থেকে 24 মাস সময়ের মধ্যে পাঁচ ভাঁজ কমে গেছে, যে সত্যিই মানে যে ডাচ কেবল সেই বিষয় নিয়ে কথা বলা বন্ধ করে দিয়েছে, অথবা এর পরিবর্তে কেবল হতে পারে যে ডাচ টুইটার চর্চা, অব্ব্রেবিয়াটিয়ন্স-এর ব্যবহার থেকে, এমনভাবে বিবর্তিত হয়েছে যে কোম্পানির ভাষা শনাক্তকরণ অ্যালগরিদম কম এবং এই ভাষাটি সনাক্ত করার ক্ষেত্রে কম নির্ভুল হয়ে উঠছে?

অতিরিক্ত তথ্য ছাড়া, এই ভাষাগত প্রবণতা দেখা যাচ্ছে কিনা তা জানার কোন উপায় নেই ।

একাধিক সামাজিক বিশ্লেষণ কোম্পানি জুড়ে ফলাফল পর্যবেক্ষণ প্রবণতা উপর আস্থা ধার দিতে পারেন, কিন্তু প্রতিটি প্ল্যাটফর্ম দ্বারা ব্যবহৃত অন্তর্নিহিত আলগোরিদিম প্রযুক্তিগত বিস্তারিত অভাব তারা একই ভাগ ব্যবহার বাস্তবে আছে কি না তা জানা অসম্ভব করে তোলে অ্যালগরিদম ।

অনেক প্ল্যাটফর্মে "গুরুত্ব" বা "ইমপ্রেশন" বা "প্রভাব" বা একটি প্রদত্ত বিষয় সম্পর্কে টুইট করা "প্রভাবের" জন্য অস্পষ্ট ব্যবস্থা প্রদান করে । কিছু এই শর্তাদির অন্তত মৌলিক সংজ্ঞা প্রদান করে, যেমন একটি প্রদত্ত বিষয় সম্পর্কে টুইট করা সমস্ত ব্যবহারকারীদের অনুসারীদের মোট সংখ্যা সুমিং. তথাপি, এই পন্থাগুলির মধ্যে কোনটি সত্যিই সন্তোষজনক নয় বা সব প্রশ্নের মধ্যে অর্থপূর্ণ.

যদি ডোনাল্ড ট্রাম্প একটি নতুন বইয়ের প্রতি তার সমর্থন টুইট করেন, তার এনডোর্সমেন্ট সম্ভবত মার্কিন জনসংখ্যার এক অর্ধেক থেকে একটি বই এবং অন্যান্য অর্ধেক একে আলিঙ্গন করতে পারে । একইভাবে, বারাক ওবামা যদি একটি বইয়ের প্রতি তার সমর্থন টুইট করেন, তাহলে এই প্রতিক্রিয়া সম্ভবত ভেরী এর এনডোর্সমেন্ট থেকে বিপরীত হবে । সংক্ষেপে, উভয় ব্যক্তি একটি নির্দিষ্ট জনসংখ্যাতাত্ত্বিক এবং আদর্শিক ভিত্তি তারা অত্যন্ত প্রভাবশালী হয়.

একটি মার্কেটার একটি উদার-নতুন বই পিচ করতে চায় শুধু সব টুইটার ব্যবহারকারীদের একটি ঐন্দ্রজালিক স্কোর "প্রভাব" এবং নির্বাচন থেকে ডোনাল্ড ভেরী চয়ন করতে অনুরোধ করতে পারেন, এবং তারা একটি রক্ষণশীল একটি বই পিচ করার জন্য বারাক ওবামাকে বাছাই করতে পারে না. তারা প্রতিটি ব্যবহারকারীর "প্রভাব জনপরিসংখ্যান" তাকান.

কিছু প্ল্যাটফর্মের এই ধরনের জনসংখ্যাতাত্ত্বিক-স্তর প্রভাববিস্তারকারী স্কোর তাদের রুটিন সারাংশ প্রদর্শন অংশ হিসাবে ।

আসলে, কিছু প্লাটফর্ম প্রকাশ করেছে যে তারা টুইটার ব্যবহারকারীদের জন্য তারা যে জনসংখ্যাতাত্ত্বিক তথ্য প্রদান করে, তা থেকে ভূগোল থেকে আয় এবং শিক্ষার মাত্রা । অ-ভূতাত্ত্বিক টুইটের অবস্থান অনুমান করা অত্যন্ত কঠিন কাজ এবং অধিকাংশ সুস্পষ্ট পন্থা আসলে কাজ করে না ।

উত্পত্তি দেশ দ্বারা ফিল্টার করা এইভাবে একটি অবিশ্বাস্যভাবে ত্রুটির প্রবণ প্রক্রিয়া, অনিশ্চিত ফলাফল সঙ্গে.

আরো মুঠোফোনের, সেখানে প্রায়ই বিপণন উপকরণ মধ্যে ধারালো বিভক্ত অনেক সামাজিক মিডিয়া বিশ্লেষণ প্লাটফর্মে নীতিহীন এবং সীমিত বাস্তবতার কিভাবে ওই প্ল্যাটফর্মগুলি আসলে কাজ করে. উদাহরণ স্বরূপ, প্ল্যাটফর্মের হিংস্র নিজেদেরকে গভীর লার্নিং কোম্পানী যে নিউরাল নেটওয়ার্ক পূর্ণ ক্ষমতা জোতা টুইটার ধারণা করতে হতে পারে. বাস্তবে, কিছু কিছু গুহা যারা আরো নিরীক্ষণের জন্য দাবি করে, তাদের স্বীকার করে যে তারা শুধুমাত্র কয়েকটি ছোটখাট বিশিষ্টতা সরঞ্জামের জন্য গভীর শেখার ব্যবহার সীমিত করে এবং সেই সরঞ্জামগুলি ডেটার ছোট র্যান্ডম নমুনার মধ্যে সীমাবদ্ধ হয়, অপ্রতিরোধ্য তাদের অ নিউরাল পন্থা উপর ভিত্তি করে ফলাফল.

সংক্ষেপে, একটি কোম্পানির মার্কেটিং ব্রোশার বিশ্বাস করবেন না – প্রতিটি অ্যালগরিদম আপনি ব্যবহার করা হবে কিনা তা নিয়ে কঠিন প্রশ্ন জিজ্ঞাসা করুন নিউরাল ভিত্তিক, naïve বয়সিয়ান বা সহজভাবে শব্দ গণনা ।

শব্দ মেঘ, গুণমান হাইস্টগ্রাম, মানচিত্র, কাস্টমাইজড আবেগ বিশ্লেষণ, ক্লাস্টার এবং অন্যান্য উচ্চতর অর্ডার বিশ্লেষণ মত সরঞ্জামের একটি গণনামূলক জটিলতা কমাতে, কিছু কোম্পানি মোট তথ্য ছোট নমুনার জন্য তাদের বিশ্লেষণ সরঞ্জাম সীমিত । যদিও মূল জিজ্ঞাসাটি এক চতুর্থাংশ বিলিয়নের বেশি টুইট করতে পারে, ফলে শব্দ ক্লাউড শুধুমাত্র সাম্প্রতিকতম 1,000 টুইট বা 10,000 টুইটের একটি র্যান্ডম নমুনার উপর ভিত্তি করে হতে পারে, যা তার কভারেজ কমিয়ে দেয় । কিছু প্ল্যাটফর্মের এই স্যাম্পলিং সম্পর্কে তাদের ইউজার ইন্টারফেসের মধ্যে বিশিষ্ট সতর্কবার্তা স্থান, অন্যরা তাদের প্রযুক্তিগত ডকুমেন্টেশন গভীর এই গুহা আছে কবর.

এই সব একসঙ্গে রাখা, সামাজিক মিডিয়া বিশ্লেষণ বিপ্লব বড় তথ্য বিশ্বের একটি বৃহত্তর প্রবণতা প্রতিফলিত: আমরা মানুষের আচরণের বৃহত্তর আর্কাইভ একত্রিত, আমরা যে আরো ঘোলা আলগোরিদিম মাধ্যমে তথ্য অন্বেষণ. আমরা এই কালো বাক্সের মাধ্যমে ডেটার পটাতে পেতাসাইট এবং রিপোর্ট করেছি যে, এমনকি ঐ প্রতিবেদনকৃত ফলাফল কোন ভাবে সঠিক বা অর্থবহ কি না বা কিভাবে তাদের সঠিকতা কোয়েরি থেকে ভিন্ন হতে পারে । পালাক্রমে, ব্যবসা এবং সরকার যে সব ধরনের জন্য হতে পারে উপর ভিত্তি করে খুব বাস্তব অর্থনৈতিক এবং নীতি সিদ্ধান্ত নেয় শুধুমাত্র একটি র্যান্ডম সংখ্যা জেনারেটর দ্বারা উত্পাদিত হয়েছে.

পরিশেষে, আমরা কিভাবে সামাজিক মিডিয়া সম্পর্কে অর্থপূর্ণ সিদ্ধান্ত নিতে পারি যে আলগোরিদিম এর ফলাফলের উপর ভিত্তি করে আমরা কিছুই জানি না?

মন্তব্য করুন

আপনার ই-মেইল এ্যাড্রেস প্রকাশিত হবে না। * চিহ্নিত বিষয়গুলো আবশ্যক।