مدل مرموزی به نام Nano-Banana این روزها سروصدای زیادی در دنیای هوش مصنوعی به پا کرده است؛ مدلی که توانایی شگفتانگیزش در تولید و ویرایش تصویر، نگاه بسیاری از فعالان فناوری را به خود جلب کرده.
برخلاف رقبای معروف که با کمپینهای تبلیغاتی پر سر و صدا معرفی میشوند، Nano-Banana بیهیچ معرفی رسمی و تنها در گوشهای از پلتفرم LMArena ظاهر شد. اما طولی نکشید که خروجیهای خلاقانه و حیرتانگیزش توسط کاربران منتشر شد و توجه همه را به قدرت خیرهکنندهاش در درک و اجرای دستورهای پیچیده جلب کرد.
توانایی این مدل فقط به تغییرات ساده محدود نمیشود؛ بلکه میتواند فرمانهای چندمرحلهای بسیار دشوار را با دقتی مثالزدنی انجام دهد. برای نمونه، کافی است از آن بخواهید شخصیتی را به 2B از بازی Nier: Automata و شخصیت دیگری را به Master Chief از Halo تبدیل کند؛ Nano-Banana نهتنها این تغییرات را بینقص اجرا میکند، بلکه نورپردازی، زاویه دید و ترکیب صحنه را نیز بهطور کامل حفظ میکند.
تصویر زیر هم نمونهای جذاب از قدرت آن است؛ جایی که دو عکس متفاوت را با مهارت بالا به یک تصویر منسجم و چشمنواز تبدیل کرده است.
مدل هوش مصنوعی Nano-Banana
مدل هوش مصنوعی Nano-Banana با عملکرد خیرهکنندهاش سر و صدای زیادی به پا کرده و حالا پرسش بزرگ این است: سازندهاش چه کسی است؟
هرچند هنوز هیچ شرکتی رسماً مسئولیت ساخت این مدل را بر عهده نگرفته، اما نگاهها بیشتر به سمت گوگل دوخته شده است. دلیل این گمانهزنیها هم روشن است؛ نخست اینکه کیفیت و سبک تصاویر تولیدی Nano-Banana شباهت چشمگیری به خروجیهای مدلهای Imagen و Gemini گوگل دارد. دوم هم اینکه گوگل سابقه طولانی در استفاده از اسم میوهها بهعنوان کدنام پروژههای محرمانهاش دارد.
قدرت واقعی Nano-Banana در توانایی فوقالعادهاش برای بازسازی و ویرایش لایههای مختلف تصویر نهفته است؛ درست شبیه آنچه در نرمافزارهایی مثل فتوشاپ میبینیم. کافی است یک دستور ساده بدهید تا این مدل پسزمینه را تغییر دهد، حالت چهره فرد را عوض کند، کیفیت یک عکس تار را ارتقا دهد یا حتی دو تصویر جداگانه را به شکلی طبیعی در یک قاب واحد ترکیب کند.
اما ماجرا به همینجا ختم نمیشود؛ Nano-Banana در حفظ یکپارچگی شخصیتها در تصاویر پشت سر هم – مثل یک کمیک استریپ – هم توانایی چشمگیری دارد. علاوهبراین، بهسادگی میتواند صحنهها را به سبکهای هنری گوناگون، از آبرنگ گرفته تا رنگروغن، تبدیل کند و خروجیهایی خلاقانه و منحصربهفرد بسازد.
البته Nano-Banana خالی از ایراد هم نیست. برخی کاربران گزارش دادهاند که این مدل گاهی دچار مشکلاتی مثل گلیچهای بصری در بازتابها، نمایش ناقص متون و خطاهای رایج در ترسیم آناتومی (بهویژه در دستها و انگشتان) میشود.
در حال حاضر راه رسمی و مشخصی برای دسترسی به این مدل وجود ندارد؛ بااینحال بعضی کاربران خوششانس توانستهاند بهطور اتفاقی در بخش Battle پلتفرم LMArena به آن برخورد کنند.
با این وجود، اگر فرضیهها درست باشد و Nano-Banana واقعاً یکی از پروژههای پنهان گوگل باشد، انتشار رسمی آن میتواند دوباره بازار رقابت در حوزه هوش مصنوعی تولید تصویر را بهشکل جدی زیر و رو کند.