مدل Gemini 3 گوگل مطابق انتظار ظاهر شده و بازی‌ها را با یک فرمان می‌سازد

admin | آبان ۳۰, ۱۴۰۴ | چت بات | بدون دیدگاه

مدل Gemini 3 گوگل بالاخره عرضه شد و نتایج آن واقعاً چشمگیر است، مخصوصاً در زمینه ساخت بازی‌های ساده.

مدل Gemini 3 Pro بسیار قدرتمند است و بنچ‌مارک‌های اولیه هم این موضوع را تأیید می‌کنند.

برای مثال، این مدل با امتیاز 1501 الُو، صدر جدول LMArena Leaderboard قرار گرفته. همچنین در آزمون‌های پیشرفته مانند Humanity’s Last Exam با امتیاز ۳۷.۵٪ (بدون استفاده از ابزار) و GPQA Diamond با امتیاز ۹۱.۹٪ عملکردی در سطح دکترای دانشگاهی داشته است.

نتایج دنیای واقعی هم این اعداد را تأیید می‌کنند. پیترو شیرانو، سازنده ابزار MagicPath، می‌گوید با Gemini 3 وارد دوره‌ای جدید شده‌ایم.

در تست‌های او، Gemini 3 Pro توانسته یک ویرایشگر سه‌بعدی LEGO را تنها با یک درخواست بسازد. یعنی یک پرامپت کافی است تا بازی‌های ساده ساخته شوند — که به‌نظر من اتفاق بزرگی است.

مدل‌های زبانی معمولاً در ساخت بازی ضعیف بوده‌اند، اما Gemini 3 در این زمینه بهبود محسوسی دارد. این موضوع با ادعاهای گوگل هم هماهنگ است؛ گوگل می‌گوید Gemini 3 Pro تعریف جدیدی از استدلال چندحالته ارائه می‌دهد و در آزمون‌های MMMU-Pro امتیاز ۸۱٪ و در Video-MMMU امتیاز ۸۷.۶٪ کسب کرده است.

گوگل در یک بلاگ‌پست اضافه می‌کند:«این مدل همچنین در آزمون SimpleQA Verified امتیاز پیشرفته ۷۲.۱٪ را کسب کرده که نشان‌دهنده پیشرفت زیاد در دقت اطلاعات است.»

همچنین اشاره کرده:«این یعنی Gemini 3 Pro توانایی بالایی در حل مسائل پیچیده در موضوعات گسترده‌ای مانند علوم و ریاضی دارد و از قابلیت اطمینان بالایی برخوردار است.»

Gemini 3 در تست‌های اولیه چشمگیر است، اما مشکل تبعیت از دستور همچنان وجود دارد.

من یک سال است که از Claude Code استفاده می‌کنم و در پروژه‌های Flutter/Dart کمک بزرگی برایم بوده است. Gemini 3 از کلود Sonnet 4.5 بهتر است، اما هنوز بخش‌هایی وجود دارد که Claude در آن‌ها برتری دارد.

تا حالا هیچ مدلی از نظر «تبعیت دقیق از دستور» به Claude Code نزدیک نشده، و Gemini 3 هم از این قاعده مستثنی نیست.

شخصاً Claude Code را در دنبال‌کردن دستورها دقیق‌تر دیدم. همچنین Claude Code به‌عنوان یک محیط خط فرمان (CLI) بهتر از Gemini 3 Pro عمل می‌کند و همین یک برتری مهم است.برای سایر کارها، Gemini 3 انتخاب بهتری است — مخصوصاً اگر قبلاً از Gemini 2.5 Pro استفاده می‌کردید.

اگر از مدل‌های هوش مصنوعی استفاده می‌کنید، پیشنهاد می‌کنم برای کارهای روزمره از Sonnet 4.5 استفاده کنید و برای پرسش‌های پیچیده سراغ Gemini 3 Pro بروید.