یکی از قوی‌ترین مدل‌های «هوش مصنوعی باز» رونمایی شد

یکی از قوی‌ترین مدل‌های «هوش مصنوعی باز» رونمایی شد

ایسنا: مدل جدید هوش مصنوعی «دیپ‌سیک وی۳»(DeepSeek V3) که توسط شرکت «دیپ‌سیک» ابداع شده است، به توسعه‌دهندگان امکان می‌دهد تا آن را برای بیشتر اپلیکیشن‌ها از جمله اپلیکیشن‌های تجاری دانلود و اصلاح کنند.

به نقل از تک کرانچ، دیپ‌سیک وی۳ می‌تواند طیف گسترده‌ای از کارها و وظایف مبتنی بر متن را مانند کدنویسی، ترجمه و نوشتن مقاله و ایمیل با توجه به درخواست انجام دهد.

براساس آزمایش‌های داخلی شرکت دیپ‌سیک، دیپ‌سیک وی۳ هم از مدل‌های قابل دانلود «باز» در دسترس و هم از مدل‌های «بسته» هوش مصنوعی که فقط از طریق API قابل دسترسی هستند، بهتر عمل می‌کند. در زیرمجموعه‌ای از رقابت‌های کدنویسی که در پلتفرم «کدفورسز«(Codeforces) میزبانی می‌شوند، دیپ‌سیک وی۳ توانست بهتر از مدل‌های دیگر مانند «Llama 3.1 405B» شرکت «متا»(Meta)، «GPT-4o» شرکت «اوپن‌ای‌آی»(OpenAI) و «Qwen 2.5 72B» شرکت «علی‌بابا»(Alibaba) عمل می‌کند.

دیپ‌سیک گفت که دیپ‌سیک وی۳ روی یک مجموعه داده متشکل از ۱۴.۸ تریلیون توکن آموزش دیده است. در علم داده، توکن‌ها برای نمایش بیت‌های داده خام استفاده می‌شوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است.

اگرچه دیپ‌سیک وی۳ کاربردی‌ترین مدل نیست اما از برخی جهات یک دستاورد به شمار می‌رود. دیپ‌سیک توانست این مدل را با استفاده از مرکز داده پردازنده‌های گرافیکی H800 شرکت «انویدیا»(Nvidia) در حدود دو ماه آموزش دهد. این شرکت خاطرنشان کرد فقط ۵.۵ میلیون دلار برای آموزش دیپ‌سیک وی۳ هزینه کرده که کسری از هزینه توسعه مدل‌هایی مانند GPT-4  است.