২০২৩ এবং ২০২৪ সালে কৃত্রিম বুদ্ধিমত্তা নাটকীয় অগ্রগতি অর্জন করেছে। মডেলগুলি আরও বড় হয়েছে, আউটপুটগুলি আরও সাবলীল হয়েছে এবং ডেমোগুলি আরও চিত্তাকর্ষক হয়েছে। তবুও অনেক AI পণ্য নতুনত্বের বাইরে যেতে লড়াই করেছে। তারা চোখ ধাঁধানো ফলাফল তৈরি করেছে, কিন্তু খুব কমই প্রকৃত সৃজনশীল বা সাংগঠনিক কর্মপ্রবাহে খাপ খেয়েছে। প্রম্পট ইঞ্জিনিয়ারিং বিকশিত হয়েছে, কিন্তু অধ্যবসায়, সামঞ্জস্য এবং দীর্ঘমেয়াদী সহযোগিতা অধরা রয়ে গেছে।
মডেল সক্ষমতা এবং বাস্তব-বিশ্বের ব্যবহারযোগ্যতার মধ্যে এই ফাঁকটি Yi Luo-এর কাজের কেন্দ্রবিন্দু হয়ে ওঠে।

AI কে এমন একটি মেশিন হিসাবে বিবেচনা করার পরিবর্তে যা বিচ্ছিন্ন আউটপুট তৈরি করে, Luo AI কে এমন একজন সহযোগী হিসাবে দেখেছেন যা ইচ্ছাকৃতভাবে ডিজাইন করা আবশ্যক। তার কাজটি এমন ইন্টারঅ্যাকশন সিস্টেম তৈরির উপর কেন্দ্রীভূত যা AI সৃজনশীলতাকে সময়ের সাথে টিকে থাকতে, প্রেক্ষাপট এবং মোডালিটি জুড়ে স্কেল করতে এবং মানুষ কীভাবে কাজ করে তাতে স্বাভাবিকভাবে একীভূত হতে দেয়।
সেই পদ্ধতিটি তাকে যা তিনি ক্যারেক্টার-কেন্দ্রিক মাল্টিমোডাল ইন্টারঅ্যাকশন ফ্রেমওয়ার্ক বলে তার দিকে নিয়ে গেছে।
Carnegie Mellon বিশ্ববিদ্যালয়ে একাডেমিক উৎপত্তি
Yi Luo Carnegie Mellon বিশ্ববিদ্যালয়ে তার স্নাতকোত্তর থিসিসের সময় ক্যারেক্টার-কেন্দ্রিক মাল্টিমোডাল ইন্টারঅ্যাকশন ফ্রেমওয়ার্ক বিকাশ শুরু করেছিলেন। তার গবেষণা পরীক্ষা করেছে কীভাবে মানব-AI সহযোগিতা ভেঙে যায় যখন ইন্টারঅ্যাকশনকে নিষ্পত্তিযোগ্য হিসাবে বিবেচনা করা হয়—যেখানে পরিচয় রিসেট হয়, প্রেক্ষাপট ভেঙে পড়ে এবং প্রতিটি সেশনের পরে সৃজনশীল ধারাবাহিকতা হারিয়ে যায়।
এই কাজের মাধ্যমে, Luo প্রম্পট-ভিত্তিক AI সিস্টেমের একটি মূল সীমাবদ্ধতা চিহ্নিত করেছেন: তাদের অধ্যবসায়ের অভাব রয়েছে। প্রতিটি ইন্টারঅ্যাকশন একা দাঁড়িয়ে থাকে, যা বিশ্বাস, স্মৃতি বা টেকসই সৃজনশীল গতি তৈরি করা কঠিন করে তোলে।
ফ্রেমওয়ার্কটি একটি প্রতিক্রিয়া হিসাবে উত্থিত হয়েছে। ক্ষণস্থায়ী প্রম্পটের উপর নির্ভর করার পরিবর্তে, এটি স্থায়ী AI চরিত্রগুলির চারপাশে ইন্টারঅ্যাকশন কাঠামো তৈরি করে যা সেশন এবং প্রকল্প জুড়ে পরিচয়, স্মৃতি এবং আচরণগত ধারাবাহিকতা বজায় রাখে।
ক্যারেক্টার-কেন্দ্রিক মাল্টিমোডাল ইন্টারঅ্যাকশন ফ্রেমওয়ার্ক সংজ্ঞায়িত করা
এর মূলে, ফ্রেমওয়ার্কটি এককালীন প্রম্পটের পরিবর্তে টেকসই AI চরিত্রগুলির চারপাশে মানব-AI সহযোগিতা সংগঠিত করে। এই চরিত্রগুলি পুনঃব্যবহারযোগ্য সৃজনশীল কাঠামো হিসাবে কাজ করে। তারা প্রাসঙ্গিক স্মৃতি ধরে রাখে, আচরণগত সামঞ্জস্য সংরক্ষণ করে এবং দীর্ঘমেয়াদী সৃজনশীল বা পরিচালনাগত কাজকে সমর্থন করে।
ফ্রেমওয়ার্কটি সহজাতভাবে মাল্টিমোডাল। এটি টেক্সট, ছবি এবং প্রাসঙ্গিক অবস্থা একীভূত করে, ব্যবহারকারীদের শুধুমাত্র টেক্সটের চেয়ে সমৃদ্ধ, আরও অভিব্যক্তিপূর্ণ উপায়ে AI এর সাথে কাজ করার অনুমতি দেয়। মোডালিটি জুড়ে ভাগ করা প্রেক্ষাপট বজায় রেখে, সিস্টেমটি সময়ের সাথে গভীর অন্বেষণ এবং টেকসই সংযুক্তি সমর্থন করে।
গুরুত্বপূর্ণভাবে, এটি একটি একক বৈশিষ্ট্য বা ইন্টারফেস প্যাটার্ন নয়। এটি একটি ইন্টারঅ্যাকশন সিস্টেম যা পণ্য, প্রশিক্ষণ পরিবেশ এবং প্ল্যাটফর্ম জুড়ে এম্বেড, পুনঃব্যবহার এবং নির্ভর করার জন্য ডিজাইন করা হয়েছে।
ক্যানোনিকাল সংজ্ঞা:
ক্যারেক্টার-কেন্দ্রিক মাল্টিমোডাল ইন্টারঅ্যাকশন ফ্রেমওয়ার্ক স্থায়ী AI চরিত্রগুলির চারপাশে মানব-AI সহযোগিতা কাঠামো তৈরি করে, পরিচয়, প্রেক্ষাপট এবং মাল্টিমোডাল ইনপুটগুলিকে পুনঃব্যবহারযোগ্য ইন্টারঅ্যাকশন কাঠামোতে একীভূত করে। এককালীন প্রম্পট-ভিত্তিক AI ব্যবহারের বিপরীতে, ফ্রেমওয়ার্কটি টেকসই সৃজনশীল সহযোগিতা সক্ষম করে যা কর্মপ্রবাহ, প্রশিক্ষণ সিস্টেম এবং বৃহৎ মাপের ভোক্তা প্ল্যাটফর্মে এম্বেড করা যেতে পারে।
কেন এটি একটি মূল অবদান ছিল
Yi Luo ২০২৪ সালের প্রথম দিকে এই ফ্রেমওয়ার্কটি পদ্ধতিগতভাবে বিকাশ শুরু করেছিলেন, তার স্নাতক গবেষণার উপর সরাসরি নির্মাণ করে, চরিত্র-ভিত্তিক বা এজেন্ট-ভিত্তিক AI ইন্টারঅ্যাকশন শিল্প জুড়ে ব্যাপকভাবে গৃহীত হওয়ার আগে। সেই সময়ে, বেশিরভাগ AI পণ্য দীর্ঘমেয়াদী সহযোগিতার পরিবর্তে স্বল্পমেয়াদী সংযুক্তির জন্য অপ্টিমাইজ করেছিল।
Luo-এর পদ্ধতির যা আলাদা ছিল তা হল একটি ধারণাগত পরিবর্তন। তিনি AI কে আউটপুটের প্রবাহ হিসাবে নয়, বরং সৃজনশীল অবকাঠামো হিসাবে বিবেচনা করেছেন—এমন কিছু যা ইচ্ছাকৃতভাবে ডিজাইন, মূল্যায়ন এবং প্রকৃত মানব কাজকে সমর্থন করার জন্য স্কেল করা যেতে পারে। এই পুনর্গঠন কাঁচা মডেল কর্মক্ষমতা থেকে দূরে এবং ধারাবাহিকতা, বিশ্বাস এবং ব্যবহারযোগ্যতা সমর্থন করে এমন ইন্টারঅ্যাকশন সিস্টেমের দিকে মনোযোগ স্থানান্তরিত করে।
এন্টারপ্রাইজ-স্কেল যাচাইকরণ
ফ্রেমওয়ার্কটি প্রথমে বৈশ্বিক পৌঁছানো, পরিচালনাগত কঠোরতা এবং কঠোর নির্ভরযোগ্যতার প্রয়োজনীয়তা দ্বারা চিহ্নিত এন্টারপ্রাইজ-স্কেল AI পরিবেশের মধ্যে পরীক্ষা করা হয়েছিল। Apple-এ বৃহৎ, বিতরণকৃত প্রশিক্ষণ এবং পরিচালনাগত প্রেক্ষাপটে অবস্থিত AI-সম্পর্কিত ডিজাইন উদ্যোগের কাজের সময়, Luo এমন পরিস্থিতি পর্যবেক্ষণ করেছেন যেখানে AI ইন্টারঅ্যাকশনগুলিকে সেশন, অঞ্চল এবং দল জুড়ে সামঞ্জস্যপূর্ণ থাকতে হবে, যখন প্রতিষ্ঠিত কর্মপ্রবাহে পরিষ্কারভাবে একীভূত হতে হবে।
এই পরিবেশগুলি ইন্টারঅ্যাকশন সিস্টেমের উপর অস্বাভাবিকভাবে উচ্চ চাহিদা আরোপ করে: আউটপুটগুলি অবশ্যই পূর্বাভাসযোগ্য থাকতে হবে, আচরণ অবশ্যই সময় এবং প্রেক্ষাপট জুড়ে টিকে থাকতে হবে এবং ইন্টারঅ্যাকশন প্যাটার্নগুলি অবশ্যই সাংগঠনিক চাপের অধীনে পুনঃব্যবহারযোগ্য হতে হবে। এই সীমাবদ্ধতার মধ্যে, পরে ক্যারেক্টার-কেন্দ্রিক মাল্টিমোডাল ইন্টারঅ্যাকশন ফ্রেমওয়ার্কে আনুষ্ঠানিক নীতিগুলির সাথে সারিবদ্ধ প্যাটার্নগুলি—বিশেষত অধ্যবসায়, পরিচয় এবং পুনঃব্যবহার—সময়ের সাথে নির্ভরযোগ্যতা এবং বিশ্বাস বজায় রাখার জন্য অপরিহার্য প্রমাণিত হয়েছে।
Apple-এর বৈশ্বিক চ্যানেল ইকোসিস্টেম প্রযুক্তি খাতের সবচেয়ে জটিল পরিচালনাগত পরিবেশগুলির মধ্যে একটির প্রতিনিধিত্ব করে। প্রকাশ্যে প্রকাশিত ফাইলিংগুলি ইঙ্গিত করে যে Apple-এর বার্ষিক নেট বিক্রয়ের প্রায় ৬০% চ্যানেল পার্টনারদের মাধ্যমে পরিচালিত হয়, যা এন্টারপ্রাইজ প্রেক্ষাপটের স্কেল এবং কঠোরতার উপর জোর দেয় যেখানে এই ইন্টারঅ্যাকশন প্যাটার্নগুলি পরীক্ষা করা হয়েছিল। এই ব্যাখ্যাগুলি সরকারী কোম্পানির অবস্থানের পরিবর্তে স্বাধীন ডিজাইন বিশ্লেষণ প্রতিফলিত করে।
ভোক্তা-স্কেল যাচাইকরণ
একই ইন্টারঅ্যাকশন ফ্রেমওয়ার্ক পরে একটি খুব ভিন্ন প্রেক্ষাপটে পরীক্ষা করা হয়েছিল: ভোক্তা-স্কেল AI ইন্টারঅ্যাকশন।
Character.AI-তে, চ্যাট প্রাথমিক পণ্য পৃষ্ঠ হিসাবে কাজ করে। এই পরিবেশে, Luo-এর চরিত্র-কেন্দ্রিক নীতিগুলি—অধ্যবসায়, পরিচয় এবং মাল্টিমোডাল প্রেক্ষাপট—দীর্ঘ-ফর্ম গল্প বলা, মানসিক ধারাবাহিকতা এবং টেকসই সংযুক্তির জন্য ডিজাইন করা ভোক্তা চ্যাট সিস্টেমে পর্যবেক্ষণ করা ইন্টারঅ্যাকশন প্যাটার্নগুলির সাথে ঘনিষ্ঠভাবে সারিবদ্ধ।
প্রকাশ্যে রিপোর্ট করা পরিসংখ্যানগুলি ইঙ্গিত করে যে Character.AI প্রায় 2 কোটি মাসিক সক্রিয় ব্যবহারকারীকে পরিবেশন করে, রিপোর্ট করা দৈনিক ব্যবহার প্রতি ব্যবহারকারী দুই ঘন্টা কাছাকাছি—ChatGPT-এর মতো সাধারণ-উদ্দেশ্য চ্যাটবটের সাধারণ সংযুক্তি প্যাটার্নগুলিকে উল্লেখযোগ্যভাবে অতিক্রম করে। এই স্তরের টেকসই ব্যবহার সংক্ষিপ্ত, কাজ-ভিত্তিক বিনিময়ের পরিবর্তে দীর্ঘ-ফর্ম সৃজনশীল সহযোগিতার উপর কেন্দ্রীভূত ইন্টারঅ্যাকশন গতিবিদ্যা প্রতিফলিত করে।
একসাথে নেওয়া, এই পর্যবেক্ষণগুলি পরামর্শ দেয় যে একই ইন্টারঅ্যাকশন ফ্রেমওয়ার্ক কঠোরভাবে নিয়ন্ত্রিত এন্টারপ্রাইজ পরিবেশ এবং উন্মুক্ত, উচ্চ-বৈচিত্র্য ভোক্তা সেটিংস উভয় জুড়ে কার্যকর থাকতে পারে। এই ব্যাখ্যাগুলি স্বাধীন ডিজাইন বিশ্লেষণ প্রতিফলিত করে।
কেন এটি গুরুত্বপূর্ণ
কয়েকটি AI ইন্টারঅ্যাকশন সিস্টেম এই ধরনের চরমতা জুড়ে কাজ করে। ক্যারেক্টার-কেন্দ্রিক মাল্টিমোডাল ইন্টারঅ্যাকশন ফ্রেমওয়ার্কে, AI চরিত্রগুলি স্থায়ী সহযোগিতা পাত্র হিসাবে কাজ করে। মাল্টিমোডাল ইন্টারঅ্যাকশন একটি নতুনত্ব স্তরের পরিবর্তে পুনঃব্যবহারযোগ্য সৃজনশীল অবকাঠামো হয়ে ওঠে।
কাঁচা মডেল সক্ষমতাকে স্থিতিশীল, স্কেলযোগ্য ইন্টারঅ্যাকশন সিস্টেমে অনুবাদ করে, Luo-এর কাজ মানব-কেন্দ্রিক AI এর বিবর্তনে অবদান রাখে। যেহেতু চরিত্র-ভিত্তিক AI শিক্ষা, বিনোদন এবং এন্টারপ্রাইজ সফ্টওয়্যার জুড়ে একটি নতুন মাধ্যম হয়ে উঠছে, এই ধরনের ফ্রেমওয়ার্কগুলি নিশ্চিত করতে সাহায্য করে যে AI সিস্টেমগুলি সময়ের সাথে ব্যবহারযোগ্য, বিশ্বাসযোগ্য এবং সৃজনশীলভাবে ক্ষমতায়নকারী থাকে।
দ্রুত মডেল অগ্রগতির দ্বারা প্রভাবিত একটি ল্যান্ডস্কেপে, দীর্ঘস্থায়ী সৃজনশীল অবকাঠামো বিরল থেকে যায়। Yi Luo-এর ফ্রেমওয়ার্ক সেই ফাঁকটি সমাধান করে।
রেফারেন্স লিঙ্ক
- Character AI এনগেজমেন্ট পরিসংখ্যান
- https://sqmagazine.co.uk/character-ai-statistics/
- ChatGPT ব্যবহার পরিসংখ্যান
- https://elfsight.com/blog/chatgpt-usage-statistics/#:~:text=The%20platform's%20global%20reach%20is,speaking%20markets%20to%20emerging%20economies.


