কৃত্রিম বুদ্ধিমত্তা ক্লাউড থেকে বেরিয়ে আমাদের ফোনে চলে আসছে। যদিও ChatGPT বা Gemini-এর মতো ক্লাউড-ভিত্তিক AI সহায়করা শিরোনাম দখল করে রয়েছে, কিন্তু একটি শান্ত তবে রূপান্তরকারী পরিবর্তন চলছে: অন-ডিভাইস ইন্টেলিজেন্স—AI মডেল যা সম্পূর্ণভাবে ব্যবহারকারীর ডিভাইসে চলে, দূরবর্তী সার্ভারে ডেটা পাঠানো ছাড়াই। এটি শুধু একটি প্রযুক্তিগত কৌতূহল নয়। অ্যাপ ডেভেলপারদের জন্য, এটি আরও ব্যক্তিগত, আরও সাশ্রয়ী এবং সম্পূর্ণ অফলাইন-সক্ষম অ্যাপ্লিকেশন তৈরির একটি কৌশলগত সুযোগের প্রতিনিধিত্ব করে। এবং যদিও সম্পূর্ণ স্বায়ত্তশাসিত অন-ডিভাইস AI সহায়কের দৃষ্টিভঙ্গি এখনও বিকশিত হচ্ছে, তবে ভিত্তিগুলো ইতিমধ্যে স্থাপন করা হচ্ছে—উন্নত হার্ডওয়্যার, অপ্টিমাইজড সফটওয়্যার এবং স্মার্ট মডেল আর্কিটেকচারের মাধ্যমে।
অন-ডিভাইস ইন্টেলিজেন্স বলতে এমন AI মডেলকে বোঝায় যা স্মার্টফোন বা অন্যান্য এজ ডিভাইসে স্থানীয়ভাবে কার্যকর হয়, ক্লাউড অবকাঠামোর উপর নির্ভর না করে।
গুরুত্বপূর্ণভাবে, যখন বিশেষজ্ঞরা অন-ডিভাইস AI-এর ভবিষ্যত নিয়ে আলোচনা করেন, তারা একটি স্বয়ংসম্পূর্ণ মডেলের কথা বলেন যা সম্পূর্ণভাবে ব্যবহারকারীর হার্ডওয়্যারে চলে।
চারটি শক্তি রয়েছে যা অন-ডিভাইস AI-এর প্রতি আগ্রহ ত্বরান্বিত করে:
গোপনীয়তা এবং নিয়ন্ত্রণ। ইউরোপ এবং কঠোর ডেটা আইন সহ অন্যান্য অঞ্চলে (যেমন GDPR), তৃতীয় পক্ষের AI পরিষেবাতে ব্যক্তিগত ডেটা প্রেরণ করা, এমনকি বিক্রেতা দাবি করলেও যে এটি সংরক্ষণ করা হবে না, ডেভেলপারদের আইনি ঝুঁকিতে ফেলতে পারে। এমনকি ডেটা প্রসেসিং চুক্তি থাকলেও, তৃতীয় পক্ষের পরিষেবাগুলি বাস্তবে কীভাবে সংবেদনশীল ডেটা পরিচালনা করে তা সম্পূর্ণভাবে নিরীক্ষণ এবং নিশ্চিত করা কঠিন।
খরচ এবং নগদীকরণ। ক্লাউড-ভিত্তিক AI-এর জন্য টোকেন প্রতি পেমেন্ট প্রয়োজন—যে খরচ সাধারণত সাবস্ক্রিপশনের মাধ্যমে ব্যবহারকারীদের উপর চাপানো হয়। কিন্তু নিম্ন আয়ের বাজারে এই ধরনের মূল্য নিষিদ্ধ হতে পারে। অন-ডিভাইস মডেল টোকেন ফি দূর করে, বিজ্ঞাপন, এককালীন ক্রয় বা ন্যূনতম সাবস্ক্রিপশনের মাধ্যমে নগদীকৃত বিনামূল্যে বা অতি-কম দামের অ্যাপ সক্ষম করে—প্রতিটি ব্যবহারকারীকে সেবা দেওয়ার প্রান্তিক খরচ নাটকীয়ভাবে হ্রাস করে।
অফলাইন উপলব্ধতা। প্রতিটি ব্যবহারকারীর নির্ভরযোগ্য ইন্টারনেট নেই। গ্রামীণ এলাকায়, ভূগর্ভস্থ পার্কিং গ্যারেজ, বেসমেন্ট ক্যাফে বা দূরবর্তী হাইকিং ট্রেইলে হোক না কেন, মানুষের এমন AI প্রয়োজন যা সংযোগ ছাড়াই কাজ করে। অন-ডিভাইস ইন্টেলিজেন্স সত্যিকারের অফলাইন অভিজ্ঞতা সক্ষম করে যেমন একটি মেনু অনুবাদ করা বা একটি ফটো থেকে একটি উদ্ভিদ সনাক্ত করা।
লেটেন্সি এবং প্রতিক্রিয়াশীলতা। ক্লাউড-ভিত্তিক AI নেটওয়ার্ক রাউন্ড-ট্রিপ বিলম্ব প্রবর্তন করে—সাধারণত ভাল সংযোগেও 100–500ms। লাইভ অনুবাদ, ভয়েস কমান্ড বা AR ওভারলেয়ের মতো রিয়েল-টাইম ব্যবহারের ক্ষেত্রে, এই লেটেন্সি অগ্রহণযোগ্য। অন-ডিভাইস ইনফারেন্স নেটওয়ার্ক বিলম্ব সম্পূর্ণভাবে দূর করে, সত্যিকারের তাৎক্ষণিক প্রতিক্রিয়া সক্ষম করে।
দ্রুত অগ্রগতি সত্ত্বেও, অন-ডিভাইস AI মূলত ট্রেড-অফের একটি খেলা। মডেল আকার, প্রতিক্রিয়া মান, ব্যাটারি ব্যবহার, মেমরি ব্যবহার এবং ডিভাইস কর্মক্ষমতা শক্তভাবে যুক্ত—এবং একটি উন্নত করা প্রায় সবসময় অন্যটিকে অবনমিত করে।
স্বতন্ত্র LLM চ্যালেঞ্জিং থাকে। ডেভেলপাররা তাদের অ্যাপে যুক্ত করতে পারে এমন মডেল—যেমন Gemma 3n, Deepseek R1 1.5B বা Phi-4 Mini—আক্রমণাত্মক কোয়ান্টাইজেশনের পরেও 1–3 GB ওজনের হয়। এটি অ্যাপ স্টোর বান্ডেলের জন্য অত্যন্ত বড়, ইনস্টলেশনের পরে আলাদা ডাউনলোড প্রয়োজন। এবং কর্মক্ষমতা ব্যাপকভাবে পরিবর্তিত হয়: NPU সহ হাই-এন্ড ফোনে, ইনফারেন্স মসৃণভাবে চলে; মিড-রেঞ্জ ডিভাইসে, একই মডেল পিছিয়ে যেতে পারে, অতিরিক্ত গরম হতে পারে বা আক্রমণাত্মক মেমরি ব্যবস্থাপনা দ্বারা বন্ধ হতে পারে।
প্ল্যাটফর্ম-ইন্টিগ্রেটেড AI আরও পরিপক্ক। Google-এর Gemini Nano (AICore API এর মাধ্যমে Pixel এবং নির্বাচিত Samsung ডিভাইসে উপলব্ধ) এবং Apple Intelligence (iOS 18+) ডেভেলপারদের তাদের নিজস্ব মডেল পাঠানো ছাড়াই অন-ডিভাইস সক্ষমতা প্রদান করে। এগুলো সংক্ষিপ্তকরণ, স্মার্ট রিপ্লাই এবং টেক্সট পুনর্লিখন দক্ষতার সাথে পরিচালনা করে—কিন্তু ডেভেলপারদের নির্দিষ্ট প্ল্যাটফর্ম এবং ডিভাইস স্তরে লক করে।
সংকীর্ণ ML মডেল আজ সবচেয়ে ভালো কাজ করে। রিয়েল-টাইম স্পিচ রিকগনিশন, ফটো এনহান্সমেন্ট, অবজেক্ট ডিটেকশন এবং লাইভ ক্যাপশনিংয়ের মতো কাজগুলো বেশিরভাগ ডিভাইসে নির্ভরযোগ্য। এগুলো সাধারণ-উদ্দেশ্য LLM নয়—এগুলো বিশেষায়িত, অত্যন্ত অপ্টিমাইজড মডেল (প্রায়শই 100 MB-এর নিচে) যা একটি কাজের জন্য তৈরি। এজ AI ফ্রেমওয়ার্ক সেগুলোকে প্ল্যাটফর্ম জুড়ে অ্যাপ ডেভেলপারদের কাছে অ্যাক্সেসযোগ্য করে তোলে।
হাইব্রিড সমঝোতা। Google এবং Apple উভয়ই স্তরযুক্ত প্রসেসিং বাস্তবায়ন করে: Gemini Nano এবং Apple Intelligence স্থানীয়ভাবে সংক্ষিপ্তকরণ, স্মার্ট রিপ্লাই এবং টেক্সট পুনর্লিখন পরিচালনা করে, যখন জটিল যুক্তি, মাল্টি-টার্ন কথোপকথন এবং জ্ঞান-নিবিড় প্রশ্নগুলো ক্লাউড অবকাঠামোতে রাউট করা হয় (Google-এর Gemini সার্ভার, Apple-এর Private Cloud Compute)। এই বাস্তবসম্মত পদ্ধতি ফাঁক পূরণ করে—কিন্তু জোর দেয় যে সম্পূর্ণ অন-ডিভাইস, সাধারণ-উদ্দেশ্য AI এখনও আকাঙ্ক্ষিত।
অন-ডিভাইস AI কার্যকর করতে তিনটি ফ্রন্টে অগ্রগতি প্রয়োজন:
তিনটি ক্ষেত্রেই কাজ চলছে—এবং অগ্রগতি ত্বরান্বিত হচ্ছে।
আদর্শ অন-ডিভাইস AI ডেভেলপার মোবাইল ইঞ্জিনিয়ারিং এবং মেশিন লার্নিংয়ের ছেদে বসে। বেশিরভাগ AI বিশেষজ্ঞ ক্লাউড অবকাঠামো এবং GPU/TPU ক্লাস্টারে ফোকাস করেন—প্রচুর মেমরি, শক্তি এবং কম্পিউট সহ পরিবেশ। তারা খুব কমই মোবাইল-নির্দিষ্ট সীমাবদ্ধতার সম্মুখীন হন: কঠোর মেমরি সীমা, আক্রমণাত্মক ব্যাকগ্রাউন্ড অ্যাপ টার্মিনেশন, থার্মাল থ্রটলিং এবং সীমিত ব্যাটারি বাজেট। এটি একটি নতুন বিশেষীকরণের জন্ম দিয়েছে: এজ AI ইঞ্জিনিয়ারিং।
এই ক্ষেত্রে ডেভেলপারদের অবশ্যই:
গুরুত্বপূর্ণভাবে, "সম্পূর্ণ অন-ডিভাইস" বলতে বোঝায় AI ইনফারেন্স কোথায় চলে—অ্যাপটি ইন্টারনেট অ্যাক্সেস করতে পারে কিনা তা নয়। একটি স্থানীয় মডেল এখনও টুল হিসাবে বাহ্যিক API কল করতে পারে (যেমন একটি ওয়েব সার্চ বা আবহাওয়া পরিষেবা), কিন্তু AI যুক্তি নিজেই সম্পূর্ণভাবে ডিভাইসে ঘটে। অন-ডিভাইস ইনফারেন্স এবং টুল কলিংয়ের সাথে, আপনি গোপনীয়তা সংরক্ষণ করেন (প্রসেসিংয়ের জন্য কোনো ব্যবহারকারী ডেটা পাঠানো হয় না) যখন এখনও কার্যকারিতা প্রসারিত করেন।
দ্রুত অগ্রগতি সত্ত্বেও, অন-ডিভাইস AI মাল্টি-স্টেপ যুক্তি, কোড জেনারেশন বা দীর্ঘ ওপেন-এন্ডেড কথোপকথনের মতো জটিল কাজের জন্য ক্লাউড AI প্রতিস্থাপন করবে না। ব্যবহারকারীরা স্থানীয় মডেলগুলো কী করতে পারে তা অতিরিক্ত মূল্যায়ন করতে পারে—যদি কর্মক্ষমতা পিছিয়ে যায় তবে হতাশার দিকে পরিচালিত করে। বাজেট ফোনে ChatGPT-স্তরের মান আশা করবেন না।
কিন্তু ভালোভাবে-সংজ্ঞায়িত, উচ্চ-মূল্যের ব্যবহারের ক্ষেত্রে, ভবিষ্যৎ উজ্জ্বল:
মডেলগুলো সংকুচিত হওয়ার সাথে সাথে, NPU মানসম্মত হয় এবং ফ্রেমওয়ার্ক পরিপক্ক হয়, অন-ডিভাইস AI প্রথম দিকের-গ্রহণকারী অভিনবত্ব থেকে মানসম্মত অনুশীলনে স্থানান্তরিত হবে।
অন-ডিভাইস ইন্টেলিজেন্স শুধু গতি বা সুবিধা সম্পর্কে নয়—এটি AI সম্পর্কে আমরা কীভাবে চিন্তা করি তার একটি প্যারাডাইম শিফট: কেন্দ্রীভূত, সাবস্ক্রিপশন-ভিত্তিক পরিষেবা থেকে আমাদের পকেটে বসবাসকারী ব্যক্তিগত, ব্যক্তিগত এবং সর্বদা-প্রস্তুত সহায়কদের দিকে।
অ্যাপ ডেভেলপারদের জন্য, এটি আরও নৈতিক, অন্তর্ভুক্তিমূলক এবং স্থিতিস্থাপক অ্যাপ্লিকেশন তৈরির একটি পথ খুলে দেয়—ক্লাউড নির্ভরতা বা জটিল ডেটা সম্মতি প্রয়োজনীয়তা ছাড়াই। প্রযুক্তি এখনও নিখুঁত নয়, কিন্তু দিকটি স্পষ্ট। আমরা ইতিমধ্যে বেশিরভাগ মানুষ যা উপলব্ধি করে তার চেয়ে কাছাকাছি। গতিপথ স্পষ্ট—এবং গতি ত্বরান্বিত হচ্ছে।


মার্কেটস
শেয়ার করুন
এই আর্টিকেল শেয়ার করুন
লিংক কপি করুনX (Twitter)LinkedInFacebookEmail
AI বটের টিপিং ভুল $450,000 মেমের সুযোগ দেয়
