যাপিত জীবনে কৃত্রিম বুদ্ধিমত্তা বা এআই টুলের ব্যবহার বাড়ছেই। ফলে কোন কনটেন্ট এআই দিয়ে তৈরি আর কোনটি মানুষের তৈরি তা বোঝা জরুরি হয়ে পড়ছে। পরামর্শক কোম্পানি ডেলয়েট তাদের তৈরি এক রিপোর্টে এআইজনিত ভুল থাকার কারণে অস্ট্রেলিয়া সরকারকে আংশিক টাকা ফেরত দিয়েছে। অন্যদিকে আদালতে জমা দেওয়া নথিতে মিথ্যা, এআই দিয়ে তৈরি রেফারেন্স থাকায় এক আইনজীবীও শাস্তির মুখে পড়েছেন। এসব ঘটনার পর নানা ধরনের ‘এআই ডিটেকশন’ টুল বাজারে দ্রুত জনপ্রিয় হচ্ছে। যেগুলোর লক্ষ্য কোনো কনটেন্ট সত্যি কিনা, মানবসৃষ্ট কিনা, নাকি এআই বানিয়েছে তা শনাক্ত করতে সাহায্য করা। তবে এ টুলগুলো আসলে কীভাবে কাজ করে আর সত্যিই কতটা কার্যকর সেটা জানাও জরুরি।
এআই ডিটেকটরের কাজ
এআই টুল সাধারণত বিভিন্ন পদ্ধতি ব্যবহার করে। টুলগুলোর কার্যকারিতা নির্ভর করে কোন ধরনের কনটেন্ট বিশ্লেষণ করা হচ্ছে তার ওপর। টেক্সটভিত্তিক ডিটেকটর সাধারণত বাক্য গঠন, শব্দ ব্যবহারের ধরন, বাক্যে কোন শব্দের উপস্থিতির সম্ভাবনা এসব ‘স্বাক্ষরগত’ প্যাটার্ন দেখে অনুমান করে কনটেন্টে এআইয়ের ভূমিকা আছে কিনা। সমস্যা হলো, মানুষের লেখা আর এআইয়ের লেখা ধীরে ধীরে একই রকম হয়ে যাচ্ছে। ফলে এ ধরনের সিগনেচার ভিত্তিক টুল প্রায়ই ভুল সিদ্ধান্ত দেয়। ছবির ক্ষেত্রে কিছু এআই ডিটেকটর ছবি ফাইলের ভেতরে থাকা গোপন মেটাডেটা বিশ্লেষণ করে, যা অনেক এআই টুল তৈরি করার সময় রেখে দেয়। উদাহরণ হিসেবে, ‘কনটেন্ট ক্রেডেনশিয়ালস ইনস্পেক্ট’ টুলটি কোনো ছবি বা কনটেন্ট কীভাবে এডিট করা হয়েছে তা দেখায়। ছবিকেও মানবসৃষ্ট ও এআই দিয়ে তৈরি কিনা যাচাইয়ের জন্য ভেরিফায়েড ডেটাসেটের সঙ্গে তুলনা করা যায় যেমন ‘ডিপফেইক ডেটাসেট’।
কিছু এআই ডেভেলপার আউটপুটে ‘ওয়াটারমার্ক’ যোগ করছে। এ ওয়াটারমার্কগুলো মানুষের চোখে ধরা পড়ে না, কিন্তু কিছু নির্দিষ্ট কোম্পানি তা শনাক্ত করতে পারে। তবে বড় কোনো কোম্পানি এখনো এসব শনাক্তকরণ টুল জনসাধারণের জন্য উন্মুক্ত করেনি। তবে জনপ্রিয় এসব পদ্ধতিরই কিছু না কিছু সীমাবদ্ধতা রয়েছে।
এআই ডিটেকটর কতটা কার্যকর
এআই ডিটেকটর কতটা কার্যকর হবে তা নির্ভর করে বেশ কিছু কারণের ওপর। এর মধ্যে রয়েছে কোন টুল দিয়ে কনটেন্ট তৈরি হয়েছে, তৈরি হওয়ার পর কনটেন্ট এডিট করা হয়েছে কিনা, ডিটেকটরের ট্রেনিং ডেটা কতটা বৈচিত্র্যপূর্ণ ইত্যাদি। উদাহরণ হিসেবে, এআই দিয়ে তৈরি ছবির ডেটাসেটে অনেক সময় পুরো দেহ দেখা যায় এমন মানুষের ছবি কম থাকে বা কিছু সংস্কৃতির মানুষের ছবি থাকে না। ফলে এসব ক্ষেত্রে শনাক্তকরণ ভুল হওয়ার সম্ভাবনা বেশি।
ওয়াটারমার্কভিত্তিক সিস্টেম একই কোম্পানির এআই দিয়ে তৈরি আউটপুট শনাক্ত করতে তুলনামূলক কার্যকর। উদাহরণ হিসেবে গুগলের ‘ইমেজেন’ মডেল দিয়ে ছবি বানালে ‘সিন্থআইডি’ টুল তা শনাক্ত করতে পারে বলে দাবি করা হচ্ছে। তবে ‘সিন্থআইডি’ এখনো সবার জন্য উন্মুক্ত নয়। গুগলের নয়, এমন এআই যেমন চ্যাটজিপিটির তৈরি কনটেন্ট শনাক্ত করতে পারে না। এআই ডেভেলপারদের মধ্যকার আন্তঃসংযোগের অভাব এখানে বড় সমস্যা। এআই আউটপুট পরিবর্তন করলেও ডিটেক্টর বিভ্রান্ত হয় যেমন ভয়েস ক্লোন করা অডিওতে নয়েজ যোগ করা বা কোয়ালিটি কমালে শনাক্তকরণ কাজ করে না। ছবির ক্ষেত্রেও একই সমস্যা তৈরি হয়। আরেকটি বড় সমস্যা ‘ব্যাখ্যা করার সক্ষমতা’। এআই ডিটেকটর টুলগুলো অনেক সময় ‘কনফিডেন্স অ্যাস্টিমেট’ দেখায়। এতে কনটেন্টটি কতটা এআই দিয়ে তৈরি তা শতকরা হারে দেখানো হয়। তবে কোনো ব্যাখ্যা দেওয়া হয় না যে, কেন এমন মনে করছে।
সব মিলিয়ে এআই শনাক্তকরণ প্রযুক্তি এখনো প্রাথমিক পর্যায়ে রয়েছে। ডিপফেইক শনাক্তকরণে মেটার চ্যালেঞ্জ দেখায় ট্রেইনিং ডেটা আর টেস্ট ডেটা একই হলে নিখুঁত ফল পাওয়া যায় কিন্তু নতুন ডেটায় এটি ভালো ফলাফল দেখাতে পারে না। নতুন ডেটাসেটে মডেল পাঁচটির মধ্যে তিনটি ডিপফেইক ধরতে পেরেছিল। এতে বোঝা যায় এআই ডিটেক্টর ভুল করতেই পারে। তারা কখনো মানুষের তৈরি করা কনটেন্টকে এআই দিয়ে তৈরি বলতে পারে আবার কখনো এআই দিয়ে তৈরি কনটেন্টকে মানুষের তৈরি বলতে পারে। এ ধরনের ভুল অনেক সময় ক্ষতিকর হতে পারে যেমন একজন শিক্ষার্থীর লেখা প্রবন্ধ এআই দিয়ে তৈরি ভেবে বাতিল হওয়া অথবা কেউ ভুল করে একটি এআই দিয়ে লেখা ইমেইলকে সত্যিই কোনো মানুষ লিখেছে বলে মনে করতে পারে।
এক টুলে নির্ভরতা নয়
কোনো কনটেন্টে এআই শনাক্ত করার জন্য একটি মাত্র টুলের ওপর নির্ভর করা ঝুঁকিপূর্ণ। বরং বিভিন্ন পদ্ধতি মিলিয়ে যাচাই করাই নিরাপদ। টেক্সটের ক্ষেত্রে তথ্য মিলিয়ে দেখা ও উৎস যাচাই করা উচিত। ছবির ক্ষেত্রে দাবি করা সময় ও জায়গার অন্য ছবি বা ভিডিওর সঙ্গে তুলনা করতে হবে। কোনোটিতে সন্দেহ হলে অতিরিক্ত প্রমাণ এবং ব্যাখ্যা চাইতে হবে।
তবে শেষ পর্যন্ত, বিশ^াসযোগ্য ব্যক্তি ও কোম্পানির ওপর নির্ভরতা এখনো সবচেয়ে কার্যকর নিরাপত্তা হিসেবে বিবেচিত। বিশেষ করে ডিটেকশন টুল যখন ব্যর্থ হয় বা আর কোনো বিকল্প পথ থাকে না।
