MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।MaGGIe প্রাকৃতিক ছবিতে চুল রেন্ডারিং এবং ইনস্ট্যান্স পৃথকীকরণে দক্ষতা প্রদর্শন করে, জটিল, বহু-ইনস্ট্যান্স পরিস্থিতিতে MGM এবং InstMatt-কে ছাড়িয়ে যায়।

শক্তিশালী মাস্ক-গাইডেড ম্যাটিং: নয়েজি ইনপুট এবং অবজেক্ট বহুমুখিতা পরিচালনা

2025/12/21 02:00
2 মিনিটে পড়া যাবে
এই বিষয়বস্তু সম্পর্কে মতামত বা উদ্বেগ জানাতে, অনুগ্রহ করে আমাদের সাথে crypto.news@mexc.com ঠিকানায় যোগাযোগ করুন

সারসংক্ষেপ এবং ১. ভূমিকা

  1. সম্পর্কিত কাজসমূহ

  2. MaGGIe

    ৩.১. দক্ষ মাস্কড গাইডেড ইনস্ট্যান্স ম্যাটিং

    ৩.২. ফিচার-ম্যাট টেম্পোরাল কনসিস্টেন্সি

  3. ইনস্ট্যান্স ম্যাটিং ডেটাসেট

    ৪.১. ইমেজ ইনস্ট্যান্স ম্যাটিং এবং ৪.২. ভিডিও ইনস্ট্যান্স ম্যাটিং

  4. পরীক্ষা-নিরীক্ষা

    ৫.১. ইমেজ ডেটার উপর প্রি-ট্রেনিং

    ৫.২. ভিডিও ডেটার উপর ট্রেনিং

  5. আলোচনা এবং তথ্যসূত্র

\ সম্পূরক উপাদান

  1. আর্কিটেকচারের বিস্তারিত

  2. ইমেজ ম্যাটিং

    ৮.১. ডেটাসেট তৈরি এবং প্রস্তুতি

    ৮.২. ট্রেনিং বিস্তারিত

    ৮.৩. পরিমাণগত বিস্তারিত

    ৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

  3. ভিডিও ম্যাটিং

    ৯.১. ডেটাসেট তৈরি

    ৯.২. ট্রেনিং বিস্তারিত

    ৯.৩. পরিমাণগত বিস্তারিত

    ৯.৪. আরো গুণগত ফলাফল

৮.৪. প্রাকৃতিক ছবিতে আরো গুণগত ফলাফল

চিত্র ১৩ চ্যালেঞ্জিং পরিস্থিতিতে আমাদের মডেলের কর্মক্ষমতা প্রদর্শন করে, বিশেষত চুলের অঞ্চলগুলি সঠিকভাবে রেন্ডার করায়। আমাদের ফ্রেমওয়ার্ক ধারাবাহিকভাবে বিস্তারিত সংরক্ষণে MGM⋆ কে ছাড়িয়ে যায়, বিশেষত জটিল ইনস্ট্যান্স ইন্টারঅ্যাকশনে। InstMatt এর সাথে তুলনায়, আমাদের মডেল অস্পষ্ট অঞ্চলে উন্নত ইনস্ট্যান্স বিচ্ছেদ এবং বিস্তারিত নির্ভুলতা প্রদর্শন করে।

\ চিত্র ১৪ এবং চিত্র ১৫ একাধিক ইনস্ট্যান্স জড়িত চরম ক্ষেত্রে আমাদের মডেল এবং পূর্ববর্তী কাজের কর্মক্ষমতা চিত্রিত করে। যদিও MGM⋆ ঘন ইনস্ট্যান্স পরিস্থিতিতে শব্দ এবং নির্ভুলতার সাথে লড়াই করে, আমাদের মডেল উচ্চ নির্ভুলতা বজায় রাখে। InstMatt, অতিরিক্ত ট্রেনিং ডেটা ছাড়াই, এই জটিল সেটিংসে সীমাবদ্ধতা দেখায়।

\ আমাদের মাস্ক-গাইডেড পদ্ধতির দৃঢ়তা চিত্র ১৬ তে আরও প্রদর্শিত হয়েছে। এখানে, আমরা MGM ভ্যারিয়েন্ট এবং SparseMat মাস্ক ইনপুটে অনুপস্থিত অংশগুলি পূর্বাভাসে যে চ্যালেঞ্জগুলির সম্মুখীন হয় তা তুলে ধরি, যা আমাদের মডেল সমাধান করে। তবে, এটি লক্ষ করা গুরুত্বপূর্ণ যে আমাদের মডেল একটি হিউম্যান ইনস্ট্যান্স সেগমেন্টেশন নেটওয়ার্ক হিসাবে ডিজাইন করা হয়নি। চিত্র ১৭ তে দেখানো হয়েছে, আমাদের ফ্রেমওয়ার্ক ইনপুট গাইডেন্স মেনে চলে, একই মাস্কে একাধিক ইনস্ট্যান্স থাকলেও সুনির্দিষ্ট আলফা ম্যাট পূর্বাভাস নিশ্চিত করে।

\ পরিশেষে, চিত্র ১২ এবং চিত্র ১১ আমাদের মডেলের সাধারণীকরণ ক্ষমতার উপর জোর দেয়। মডেলটি পটভূমি থেকে মানব বিষয় এবং অন্যান্য বস্তু উভয়ই সঠিকভাবে নিষ্কাশন করে, বিভিন্ন পরিস্থিতি এবং অবজেক্ট টাইপ জুড়ে এর বহুমুখিতা প্রদর্শন করে।

\ সমস্ত উদাহরণ হল ইন্টারনেট ছবি গ্রাউন্ড-ট্রুথ ছাড়া এবং r101fpn400e থেকে মাস্ক গাইডেন্স হিসাবে ব্যবহার করা হয়েছে।

\ চিত্র ১৩. আমাদের মডেল প্রাকৃতিক ছবিতে অত্যন্ত বিস্তারিত আলফা ম্যাট তৈরি করে। আমাদের ফলাফল দেখায় যে এটি ব্যয়বহুল কম্পিউটেশনাল খরচ ছাড়াই পূর্ববর্তী ইনস্ট্যান্স-অজ্ঞেয়বাদী এবং ইনস্ট্যান্স-সচেতনতা পদ্ধতিগুলির সাথে সঠিক এবং তুলনীয়। লাল বর্গ প্রতিটি ইনস্ট্যান্সের জন্য বিস্তারিত অঞ্চলগুলি জুম করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৪. আমাদের ফ্রেমওয়ার্ক অনেক ইনস্ট্যান্স সহ চরম ক্ষেত্রে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। যদিও MGM প্রায়ই ইনস্ট্যান্সগুলির মধ্যে ওভারল্যাপিং ঘটায় এবং MGM⋆ শব্দ ধারণ করে, আমাদের বাহ্যিক ডেটাসেটে প্রশিক্ষিত InstMatt এর সাথে সমান ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৫. আমাদের ফ্রেমওয়ার্ক একক পাসে সুনির্দিষ্টভাবে ইনস্ট্যান্সগুলি আলাদা করে। প্রস্তাবিত সমাধান পূর্বাভাস/পরিমার্জন পাঁচবার চালানো ছাড়াই InstMatt এবং MGM এর সাথে তুলনীয় ফলাফল দেখায়। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৬. MGM এবং SparseMat থেকে ভিন্ন, আমাদের মডেল ইনপুট গাইডেন্স মাস্কে দৃঢ়। অ্যাটেনশন হেড সহ, আমাদের মডেল InstMatt এর মতো ইনস্ট্যান্সগুলির মধ্যে জটিল পরিমার্জন ছাড়াই মাস্ক ইনপুটগুলিতে আরও স্থিতিশীল ফলাফল তৈরি করে। লাল তীর ত্রুটি নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ চিত্র ১৭. আমাদের সমাধান মাল্টি-ইনস্ট্যান্স মাস্ক গাইডেন্সের সাথে সঠিকভাবে কাজ করে। যখন একটি গাইডেন্স মাস্কে একাধিক ইনস্ট্যান্স বিদ্যমান থাকে, আমরা এখনও সেই ইনস্ট্যান্সগুলির জন্য সঠিক ইউনিয়ন আলফা ম্যাট তৈরি করি। লাল তীর ত্রুটি বা লাল বক্সে জুম-ইন অঞ্চল নির্দেশ করে। (রঙিন এবং ডিজিটাল জুমে সর্বোত্তম দেখা যায়)।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে।

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১২. HIM2K+M-HIM2K এ পরিমাণগত ফলাফলের বিস্তারিত (সারণি ৫ এর সম্প্রসারণ)। ধূসর পুনরায় প্রশিক্ষণ ছাড়াই পাবলিক ওয়েট নির্দেশ করে। (অব্যাহত)

\ সারণি ১৩. V-HIM60 এ প্রস্তাবিত টেম্পোরাল কনসিস্টেন্সি মডিউলের কার্যকারিতা (সারণি ৬ এর সম্প্রসারণ)। দ্বি-দিকীয় Conv-GRU এবং ফরওয়ার্ড-ব্যাকওয়ার্ড ফিউশনের সংমিশ্রণ তিনটি টেস্ট সেটে সর্বোত্তম সামগ্রিক কর্মক্ষমতা অর্জন করে। বোল্ড প্রতিটি স্তরের জন্য সেরা হাইলাইট করে।

\

:::info লেখকগণ:

(১) চুয়ং হুইন, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক (chuonghm@cs.umd.edu);

(২) সেউং উগ ও, অ্যাডোব রিসার্চ (seoh,jolee@adobe.com);

(৩) অভিনব শ্রীবাস্তব, ইউনিভার্সিটি অফ মেরিল্যান্ড, কলেজ পার্ক (abhinav@cs.umd.edu);

(৪) জুন-ইয়াং লি, অ্যাডোব রিসার্চ (jolee@adobe.com)।

:::


:::info এই গবেষণাপত্রটি CC by 4.0 Deed (Attribution 4.0 International) লাইসেন্সের অধীনে arxiv এ উপলব্ধ

:::

\

মার্কেটের সুযোগ
Mask Network লোগো
Mask Network প্রাইস(MASK)
$0.4566
$0.4566$0.4566
+0.72%
USD
Mask Network (MASK) লাইভ প্রাইস চার্ট
ডিসক্লেইমার: এই সাইটে পুনঃপ্রকাশিত নিবন্ধগুলো সর্বসাধারণের জন্য উন্মুক্ত প্ল্যাটফর্ম থেকে সংগ্রহ করা হয়েছে এবং শুধুমাত্র তথ্যের উদ্দেশ্যে প্রদান করা হয়েছে। এগুলো আবশ্যিকভাবে MEXC-এর মতামতকে প্রতিফলিত করে না। সমস্ত অধিকার মূল লেখকদের কাছে সংরক্ষিত রয়েছে। আপনি যদি মনে করেন কোনো কনটেন্ট তৃতীয় পক্ষের অধিকার লঙ্ঘন করেছে, তাহলে অনুগ্রহ করে অপসারণের জন্য crypto.news@mexc.com এ যোগাযোগ করুন। MEXC কনটেন্টের সঠিকতা, সম্পূর্ণতা বা সময়োপযোগিতা সম্পর্কে কোনো গ্যারান্টি দেয় না এবং প্রদত্ত তথ্যের ভিত্তিতে নেওয়া কোনো পদক্ষেপের জন্য দায়ী নয়। এই কনটেন্ট কোনো আর্থিক, আইনগত বা অন্যান্য পেশাদার পরামর্শ নয় এবং এটি MEXC-এর সুপারিশ বা সমর্থন হিসেবে গণ্য করা উচিত নয়।

আপনি আরও পছন্দ করতে পারেন

SlideFunBot Planet Hares-এর সাথে অংশীদারিত্ব করে মেমে কয়েন ট্রেডিং এবং মেটাভার্স ইন্টিগ্রেশনের মাধ্যমে Web3 ক্রস-চেইন ইন্টারঅপারেবিলিটি উন্নত করতে

SlideFunBot Planet Hares-এর সাথে অংশীদারিত্ব করে মেমে কয়েন ট্রেডিং এবং মেটাভার্স ইন্টিগ্রেশনের মাধ্যমে Web3 ক্রস-চেইন ইন্টারঅপারেবিলিটি উন্নত করতে

এই অংশীদারিত্ব SlideFunBot কে Planet Hares-এর অবকাঠামো ব্যবহার করে বিভিন্ন মেটাভার্স বিশ্বে মিম টোকেন অ্যাপ্লিকেশনগুলি নগদীকরণ করতে ব্যবহারকারীদের সক্ষম করতে দেয়।
শেয়ার করুন
Blockchainreporter2026/03/15 17:00
ইসরائেল ইরান হামলা: সামরিক বাহিনীর পশ্চিম ইরানে ব্যাপক আক্রমণের মাধ্যমে গুরুতর উত্তেজনা বৃদ্ধি

ইসরائেল ইরান হামলা: সামরিক বাহিনীর পশ্চিম ইরানে ব্যাপক আক্রমণের মাধ্যমে গুরুতর উত্তেজনা বৃদ্ধি

বিটকয়েনওয়ার্ল্ড ইসরায়েল ইরান হামলা: সামরিক বাহিনী পশ্চিম ইরানে ব্যাপক আক্রমণ চালানোর সাথে সাথে গুরুতর উত্তেজনা বৃদ্ধি আঞ্চলিক শত্রুতার একটি গুরুতর বৃদ্ধিতে, ইসরায়েল
শেয়ার করুন
bitcoinworld2026/03/15 17:45
অল্টসিজন শেষ: ছোট ক্রিপ্টো সাইকেল এবং তীব্র রোটেশন আশা করুন

অল্টসিজন শেষ: ছোট ক্রিপ্টো সাইকেল এবং তীব্র রোটেশন আশা করুন

ঐতিহ্যবাহী অল্টকয়েন চক্র, যা একসময় "অল্টসিজন" নামে পরিচিত ব্যাপক বাজার র‍্যালি দ্বারা সংজ্ঞায়িত ছিল, এখন আরও কেন্দ্রীভূত, নির্বাচনী গতিশীলতার পথ দিচ্ছে। শিল্পের অভিজ্ঞরা
শেয়ার করুন
Crypto Breaking News2026/03/15 17:25