طوفان دیپ‌سیک در شرکت‌های فناوری آمریکا

هوش مصنوعی جدید چینی‌ها درست در آستانه انتشار آخرین گزارشات فصلی شرکت‌های آمریکایی و همچنین چند روز مانده به سال نوی چینی طوفان به راه انداخت و باعث سقوط ارزش شرکت‌های پیشروی هوش مصنوعی در آمریکا شد.

اشتراک گذاری:

چراکه از یک سو شرکت‌های غربی به دلیل قوانین سفت و سختی که در قبل از انتشار گزارشات فصلی خود دارند؛ امکان دفاع از خود را در برابر دیپ‌سیک نداشتند و همگی در زمان رونمایی این هوش مصنوعی، مجبور به سکوت شدند. از طرفی به دلیل مقارن شدن این رونمایی با سال نوی چینی، رقبای داخلی چینی نیز از آن رو دست خوردند و این رونمایی منجر به تقلا در میان رقبای داخلی آن نظیر تیک‌تاک، علی بابا و ... برای ارتقاء مدل‌های هوش مصنوعی خود آن هم در زمانی که کارمندان به استقبال تعطیلات رفته بودند؛ شد. به عبارتی دیگر، اتاق فکر دیپ‌سیک با به‌پا کردن این طوفان، همچون گردابی، بسیاری از رقبای داخلی و خارجی خود را با بحران مواجه کرد. به‌طور مثال شرکت‌های بزرگ فناوری چینی مانند علی بابا صدها هزار کارمند دارند اما دیپ‌سیک مانند یک آزمایشگاه تحقیقاتی عمل می‌کند که عمدتاً از فارغ التحصیلان جوان و دانشجویان دکترا از دانشگاه‌های برتر چین تشکیل شده است. و این چابکی استارتاپ دیپ‌سیک می‌تواند به سرعت سهم بازار شرکت‌های بزرگ را محدودتر کند.
بسیاری از تحلیلگران بازارهای مالی از دیپ‌سیک با عنوان قوی سیاه و یا لااقل قوی خاکستری یاد می‌کنند و معتقدند رونمایی آن به قدری شوکه کننده بود که به یکباره باعث ایجاد یک کرش در بازار سهام آمریکا، به عنوان بزرگترین اقتصاد دنیا شد. دیپ‌سیک حدود یک تریلیون دلار از شاخص فناوری پیشرو در ایالات متحده را در یک هفته به دلیل ترس ناشی از عدم نیاز به سرمایه گذاری‌های بزرگ در سخت افزار گران قیمت هوش مصنوعی، از بین برد؛ چراکه این هوش مصنوعی نوظهور، با هزینه‌ای بسیار کمتر نسبت به مدل‌های آمریکایی ساخته شده است.

دیپ‌سیک دقیقا چیست؟

دیپ‌سیک یک استارت‌آپ و لابراتوار هوش مصنوعی است که در سال ۲۰۲۳ توسط تیمی از محققان چینی تأسیس شد. هدف اصلی این استارتاپ، توسعه مدل‌های هوش مصنوعی با هزینه‌ای بسیار کمتر و عملکردی قابل‌رقابت با شرکت‌های بزرگ مانند اوپن‌ای‌آی است. مدل R1 دیپ‌سیک مبتنی بر معماری Transformer طراحی شده و از تکنیک‌های یادگیری تقویتی چندمرحله‌ای استفاده می‌کند. یکی از ویژگی‌های برجسته دیپ‌سیک، استفاده از روش “خودآموزی پویا” است. برخلاف مدل‌هایی نظیر چت‌جی‌پی‌تی که برای به‌روزرسانی نیازمند داده‌های عظیم و بازآموزی‌های مکرر هستند؛ دیپ‌سیک می‌تواند با استفاده از داده‌های جدید به‌طور مداوم خود را به‌روزرسانی کند. این روش به دیپ‌سیک اجازه داده است تا با هزینه‌ای کمتر از ۱۰ میلیون دلار، مدلی ارائه دهد که با مدل‌های ۱۵۰ میلیارد دلاری رقابت می‌کند. لازم به توضیح است که مدل R1 بل انقلابی که در صنعت هوش مصنوعی ایجاد کرده است؛ علاوه بر شرکت‌های فناوری آمریکایی، به‌طور غیرمستقیم بر قیمت ارزهای دیجیتال، به‌ویژه بیت‌کوین، نیز تأثیر گذاشته است و منجر به کاهش قیمت آن شده است.

مزیت رقابتی دیپ‌سیک چیست؟

دیپ‌سیک تیم توسعه بسیار جوانی دارد و در واقع یک آزمایشگاه است که هیچ فشاری برای تجاری سازی ندارد. لذا دانشجویانی که برای این پروژه کار می‌کنند؛ هیچ انتظار درآمدی ندارند و احتمالا در آینده هیچ تیم فروشی هم نداشته باشند و دانشگاهی بودن آن باعث می‌شود؛ مدل خود را بر اساس آخرین تحقیقات متن باز به سرعت بهبود ببخشند و این یعنی هرینه کم و بازدهی بالا. دیپ‌سیک عملا با یک تیم حدودا 150 نفره موفق به ارائه چنین محصولی شده است.
دوم اینکه، دیپ‌سیک احتمالاً از سال 2019، قبل از چت‌جی‌پی‌تی ، مرکز داده خود را راه اندازی کرده ‌اند. این امر به آنها اجازه می‌دهد تا سرعت و کارایی الگوریتم‌های معاملاتی را با سخت‌افزار خریداری شده خود به حداکثر برسانند تا بیشترین بازده را برای صندوق داده خود داشته باشند. این موضوع منجر به بسیاری از نوآوری‌ها، کشف‌ها یا الگوهای جدید خواهد شد و بهینه‌سازی نرم افزار به سخت افزار تاثیر قابل توجهی در بارگذاری تعادل ترافیک پهنای باند شبکه دارد. همچنین از آنجایی که آنها هیچ هدف تجاری خاصی ندارند؛ احتمالاً منبع بازترین مدلی هستند که تا به امروز در بازار دیده شده است. این ویژگی‌ها، دیپ‌سیک را بسیار چشمگیر و جالب می‌کند.

یک بی‌اخلاقی مرسوم در اکوسیستم استارتاپی

شرکت اوپن‌ای‌آی مدعی است؛ شواهدی دارد که دیپ‌سیک چین از مدل خود برای آموزش رقبای این شرکت در فیس بوک، ایکس و لینکدین، استفاده کرده است. سازنده چت‌جی‌پی‌تی، همچنین مدعی است که احتمال سرقت مالکیت معنوی، سرقت IP وجود دارد و به‌علاوه شواهدی از «تقطیر» در به موفقیت رسیدن دیپ‌سیک به چشم می‌خورد. تقطیر در واقع، یک تکنیک مرسوم در اکوسیستم استارتاپی است که توسط توسعه‌دهندگان برای به دست آوردن عملکرد بهتر در مدل‌های کوچکتر با استفاده از خروجی‌های مدل‌های بزرگتر و تواناتر مورد استفاده قرار می‌گیرد و به آن‌ها اجازه می‌دهد تا نتایج مشابهی را در کارهای خاص با هزینه بسیار کمتر به دست آورند و علاوه بر این کار که به نوعی سرقت و درز اطلاعات محسوب می‌شود؛ کاربران مدل کوچکتر عملا نمی‌توانند هیچ یک از خدمات آن را کپی کنند یا از خروجی آن برای توسعه مدل‌هایی که با اوپن‌ای‌آی رقابت می‌کند؛ استفاده کنند.
کارشناسان معتقدند که استفاده از خروجی‌های شرکت اوپن‌ای‌آی که روی استخدام افرادی سرمایه‌گذاری کرده‌است تا به مدل‌هایشان بیاموزند که چگونه پاسخ‌هایی را تولید کنند که به نظر انسانی‌تر می‌آیند؛ برای آزمایشگاه‌های هوش مصنوعی در چین و آمریکا معمول است. و شواهد حاکی از آن است که این کار، یک روش بسیار رایج برای استارت‌آپ‌ها و دانشگاهیان است که از خروجی‌های LLM تجاری همسو با انسان، مانند چت‌جی‌پی‌تی ، برای آموزش مدل دیگری استفاده کنند.همچنین شواهد حاکی از آن است که دیپ‌سیک از 2048 کارت گرافیک Nvidia H800 استفاده کرده و 5.6 میلیون دلار برای آموزش مدل V3 خود با 671 میلیارد پارامتر هزینه کرده است که کسری از هزینه‌های شرکت اوپن‌ای‌آی و گوگل برای آموزش مدل‌هایی با اندازه مشابه است. برخی از کارشناسان گفتند که این مدل پاسخ‌هایی ایجاد می‌کند که نشان می‌دهد بر روی خروجی‌های اوپن‌ای‌آی GPT-4 آموزش دیده است که شرایط خدمات آن را نقض می‌کند.

به این مطلب امتیاز دهید:

هنوز امتیازی ثبت نشده است؛ اولین نفر باشید!

دیدگاه ها (0)