استارتاپ چینی DeepSeek دو مدل جدید هوش مصنوعی را منتشر کرده است

admin | آذر ۱۱, ۱۴۰۴ | چت بات | بدون دیدگاه

استارتاپ چینی DeepSeek دو مدل جدید هوش مصنوعی به نام‌های DeepSeek-V3.2 و DeepSeek-V3.2-Speciale را در ۱ دسامبر منتشر کرده است.

به گفته این شرکت، DeepSeek-V3.2 به‌عنوان یک دستیار روزانه برای انجام کارهای استدلالی طراحی شده و از نظر توانایی استدلال هم‌سطح GPT-5 است، در حالی که DeepSeek-V3.2-Speciale برای کارهای بسیار پیچیده ساخته شده و با Gemini-3.0-Pro قابل مقایسه است.

نسخه Speciale توانسته در چهار رقابت بین‌المللی سطح‌بالا مدال طلا کسب کند:

المپیاد جهانی ریاضی ۲۰۲۵

المپیاد جهانی کامپیوتر

فینال جهانی ICPC

المپیاد ریاضی چین

مدل DeepSeek-V3.2 همچنین قابلیتی به نام «تفکر هنگام استفاده از ابزار» معرفی کرده است؛ یعنی می‌تواند همزمان با حل یک مسئله، کارهایی مثل کدنویسی، جستجوی وب یا ویرایش فایل را انجام داده و در این فرآیند استدلال کند. این مدل از استفاده از ابزار هم در حالت «تفکر» و هم در حالت «غیرفکری» پشتیبانی می‌کند.

پژوهشگران برای آموزش این مدل‌ها از روشی جدید به نام DeepSeek Sparse Attention (DSA) استفاده کرده‌اند که هزینه محاسباتی را کاهش می‌دهد، در حالی که عملکرد بالا را حفظ می‌کند.

این شرکت گزارش فنی کامل فرایند آموزش هر دو مدل را نیز منتشر کرده است. مدل DeepSeek-V3.2 اکنون در اپلیکیشن، نسخه وب و از طریق API در دسترس است، اما DeepSeek-V3.2-Speciale فقط از طریق API قابل استفاده است.