استارتاپ چینی DeepSeek دو مدل جدید هوش مصنوعی را منتشر کرده است
استارتاپ چینی DeepSeek دو مدل جدید هوش مصنوعی به نامهای DeepSeek-V3.2 و DeepSeek-V3.2-Speciale را در ۱ دسامبر منتشر کرده است.

به گفته این شرکت، DeepSeek-V3.2 بهعنوان یک دستیار روزانه برای انجام کارهای استدلالی طراحی شده و از نظر توانایی استدلال همسطح GPT-5 است، در حالی که DeepSeek-V3.2-Speciale برای کارهای بسیار پیچیده ساخته شده و با Gemini-3.0-Pro قابل مقایسه است.
نسخه Speciale توانسته در چهار رقابت بینالمللی سطحبالا مدال طلا کسب کند:
المپیاد جهانی ریاضی ۲۰۲۵
المپیاد جهانی کامپیوتر
فینال جهانی ICPC
المپیاد ریاضی چین
مدل DeepSeek-V3.2 همچنین قابلیتی به نام «تفکر هنگام استفاده از ابزار» معرفی کرده است؛ یعنی میتواند همزمان با حل یک مسئله، کارهایی مثل کدنویسی، جستجوی وب یا ویرایش فایل را انجام داده و در این فرآیند استدلال کند. این مدل از استفاده از ابزار هم در حالت «تفکر» و هم در حالت «غیرفکری» پشتیبانی میکند.
پژوهشگران برای آموزش این مدلها از روشی جدید به نام DeepSeek Sparse Attention (DSA) استفاده کردهاند که هزینه محاسباتی را کاهش میدهد، در حالی که عملکرد بالا را حفظ میکند.
این شرکت گزارش فنی کامل فرایند آموزش هر دو مدل را نیز منتشر کرده است. مدل DeepSeek-V3.2 اکنون در اپلیکیشن، نسخه وب و از طریق API در دسترس است، اما DeepSeek-V3.2-Speciale فقط از طریق API قابل استفاده است.
