Nano-Banana؛ مهمان مرموزی که دنیای هوش مصنوعی را شگفت‌زده کرد

Nano-Banana؛ مهمان مرموزی که دنیای هوش مصنوعی را شگفت‌زده کرد

مدل مرموزی به نام Nano-Banana این روزها سروصدای زیادی در دنیای هوش مصنوعی به پا کرده است؛ مدلی که توانایی شگفت‌انگیزش در تولید و ویرایش تصویر، نگاه بسیاری از فعالان فناوری را به خود جلب کرده.

برخلاف رقبای معروف که با کمپین‌های تبلیغاتی پر سر و صدا معرفی می‌شوند، Nano-Banana بی‌هیچ معرفی رسمی و تنها در گوشه‌ای از پلتفرم  LMArena ظاهر شد. اما طولی نکشید که خروجی‌های خلاقانه و حیرت‌انگیزش توسط کاربران منتشر شد و توجه همه را به قدرت خیره‌کننده‌اش در درک و اجرای دستورهای پیچیده جلب کرد.

توانایی این مدل فقط به تغییرات ساده محدود نمی‌شود؛ بلکه می‌تواند فرمان‌های چندمرحله‌ای بسیار دشوار را با دقتی مثال‌زدنی انجام دهد. برای نمونه، کافی است از آن بخواهید شخصیتی را به 2B از بازی Nier: Automata و شخصیت دیگری را به  Master Chief از Halo تبدیل کند؛ Nano-Banana نه‌تنها این تغییرات را بی‌نقص اجرا می‌کند، بلکه نورپردازی، زاویه دید و ترکیب صحنه را نیز به‌طور کامل حفظ می‌کند.

تصویر زیر هم نمونه‌ای جذاب از قدرت آن است؛ جایی که دو عکس متفاوت را با مهارت بالا به یک تصویر منسجم و چشم‌نواز تبدیل کرده است.

Nano-Banana

مدل هوش مصنوعی Nano-Banana

مدل هوش مصنوعی Nano-Banana با عملکرد خیره‌کننده‌اش سر و صدای زیادی به پا کرده و حالا پرسش بزرگ این است: سازنده‌اش چه کسی است؟
هرچند هنوز هیچ شرکتی رسماً مسئولیت ساخت این مدل را بر عهده نگرفته، اما نگاه‌ها بیشتر به سمت گوگل دوخته شده است. دلیل این گمانه‌زنی‌ها هم روشن است؛ نخست اینکه کیفیت و سبک تصاویر تولیدی Nano-Banana شباهت چشمگیری به خروجی‌های مدل‌های Imagen و Gemini گوگل دارد. دوم هم اینکه گوگل سابقه طولانی در استفاده از اسم میوه‌ها به‌عنوان کدنام پروژه‌های محرمانه‌اش دارد.

قدرت واقعی Nano-Banana  در توانایی فوق‌العاده‌اش برای بازسازی و ویرایش لایه‌های مختلف تصویر نهفته است؛ درست شبیه آنچه در نرم‌افزارهایی مثل فتوشاپ می‌بینیم. کافی است یک دستور ساده بدهید تا این مدل پس‌زمینه را تغییر دهد، حالت چهره فرد را عوض کند، کیفیت یک عکس تار را ارتقا دهد یا حتی دو تصویر جداگانه را به شکلی طبیعی در یک قاب واحد ترکیب کند.

اما ماجرا به همین‌جا ختم نمی‌شود؛ Nano-Banana در حفظ یکپارچگی شخصیت‌ها در تصاویر پشت سر هم – مثل یک کمیک استریپ – هم توانایی چشمگیری دارد. علاوه‌براین، به‌سادگی می‌تواند صحنه‌ها را به سبک‌های هنری گوناگون، از آبرنگ گرفته تا رنگ‌روغن، تبدیل کند و خروجی‌هایی خلاقانه و منحصربه‌فرد بسازد.

البته Nano-Banana خالی از ایراد هم نیست. برخی کاربران گزارش داده‌اند که این مدل گاهی دچار مشکلاتی مثل گلیچ‌های بصری در بازتاب‌ها، نمایش ناقص متون و خطاهای رایج در ترسیم آناتومی (به‌ویژه در دست‌ها و انگشتان) می‌شود.

در حال حاضر راه رسمی و مشخصی برای دسترسی به این مدل وجود ندارد؛ بااین‌حال بعضی کاربران خوش‌شانس توانسته‌اند به‌طور اتفاقی در بخش Battle پلتفرم LMArena به آن برخورد کنند.
با این وجود، اگر فرضیه‌ها درست باشد و Nano-Banana واقعاً یکی از پروژه‌های پنهان گوگل باشد، انتشار رسمی آن می‌تواند دوباره بازار رقابت در حوزه هوش مصنوعی تولید تصویر را به‌شکل جدی زیر و رو کند.