علم و فناوری
هوش مصنوعی جدید چینیها درست در آستانه انتشار آخرین گزارشات فصلی شرکتهای آمریکایی و همچنین چند روز مانده به سال نوی چینی طوفان به راه انداخت و باعث سقوط ارزش شرکتهای پیشروی هوش مصنوعی در آمریکا شد.
چراکه از یک سو شرکتهای غربی به دلیل قوانین سفت و سختی که در قبل از انتشار گزارشات فصلی خود دارند؛ امکان دفاع از خود را در برابر دیپسیک نداشتند و همگی در زمان رونمایی این هوش مصنوعی، مجبور به سکوت شدند. از طرفی به دلیل مقارن شدن این رونمایی با سال نوی چینی، رقبای داخلی چینی نیز از آن رو دست خوردند و این رونمایی منجر به تقلا در میان رقبای داخلی آن نظیر تیکتاک، علی بابا و ... برای ارتقاء مدلهای هوش مصنوعی خود آن هم در زمانی که کارمندان به استقبال تعطیلات رفته بودند؛ شد. به عبارتی دیگر، اتاق فکر دیپسیک با بهپا کردن این طوفان، همچون گردابی، بسیاری از رقبای داخلی و خارجی خود را با بحران مواجه کرد. بهطور مثال شرکتهای بزرگ فناوری چینی مانند علی بابا صدها هزار کارمند دارند اما دیپسیک مانند یک آزمایشگاه تحقیقاتی عمل میکند که عمدتاً از فارغ التحصیلان جوان و دانشجویان دکترا از دانشگاههای برتر چین تشکیل شده است. و این چابکی استارتاپ دیپسیک میتواند به سرعت سهم بازار شرکتهای بزرگ را محدودتر کند.
بسیاری از تحلیلگران بازارهای مالی از دیپسیک با عنوان قوی سیاه و یا لااقل قوی خاکستری یاد میکنند و معتقدند رونمایی آن به قدری شوکه کننده بود که به یکباره باعث ایجاد یک کرش در بازار سهام آمریکا، به عنوان بزرگترین اقتصاد دنیا شد. دیپسیک حدود یک تریلیون دلار از شاخص فناوری پیشرو در ایالات متحده را در یک هفته به دلیل ترس ناشی از عدم نیاز به سرمایه گذاریهای بزرگ در سخت افزار گران قیمت هوش مصنوعی، از بین برد؛ چراکه این هوش مصنوعی نوظهور، با هزینهای بسیار کمتر نسبت به مدلهای آمریکایی ساخته شده است.
دیپسیک یک استارتآپ و لابراتوار هوش مصنوعی است که در سال ۲۰۲۳ توسط تیمی از محققان چینی تأسیس شد. هدف اصلی این استارتاپ، توسعه مدلهای هوش مصنوعی با هزینهای بسیار کمتر و عملکردی قابلرقابت با شرکتهای بزرگ مانند اوپنایآی است. مدل R1 دیپسیک مبتنی بر معماری Transformer طراحی شده و از تکنیکهای یادگیری تقویتی چندمرحلهای استفاده میکند. یکی از ویژگیهای برجسته دیپسیک، استفاده از روش “خودآموزی پویا” است. برخلاف مدلهایی نظیر چتجیپیتی که برای بهروزرسانی نیازمند دادههای عظیم و بازآموزیهای مکرر هستند؛ دیپسیک میتواند با استفاده از دادههای جدید بهطور مداوم خود را بهروزرسانی کند. این روش به دیپسیک اجازه داده است تا با هزینهای کمتر از ۱۰ میلیون دلار، مدلی ارائه دهد که با مدلهای ۱۵۰ میلیارد دلاری رقابت میکند. لازم به توضیح است که مدل R1 بل انقلابی که در صنعت هوش مصنوعی ایجاد کرده است؛ علاوه بر شرکتهای فناوری آمریکایی، بهطور غیرمستقیم بر قیمت ارزهای دیجیتال، بهویژه بیتکوین، نیز تأثیر گذاشته است و منجر به کاهش قیمت آن شده است.
دیپسیک تیم توسعه بسیار جوانی دارد و در واقع یک آزمایشگاه است که هیچ فشاری برای تجاری سازی ندارد. لذا دانشجویانی که برای این پروژه کار میکنند؛ هیچ انتظار درآمدی ندارند و احتمالا در آینده هیچ تیم فروشی هم نداشته باشند و دانشگاهی بودن آن باعث میشود؛ مدل خود را بر اساس آخرین تحقیقات متن باز به سرعت بهبود ببخشند و این یعنی هرینه کم و بازدهی بالا. دیپسیک عملا با یک تیم حدودا 150 نفره موفق به ارائه چنین محصولی شده است.
دوم اینکه، دیپسیک احتمالاً از سال 2019، قبل از چتجیپیتی ، مرکز داده خود را راه اندازی کرده اند. این امر به آنها اجازه میدهد تا سرعت و کارایی الگوریتمهای معاملاتی را با سختافزار خریداری شده خود به حداکثر برسانند تا بیشترین بازده را برای صندوق داده خود داشته باشند. این موضوع منجر به بسیاری از نوآوریها، کشفها یا الگوهای جدید خواهد شد و بهینهسازی نرم افزار به سخت افزار تاثیر قابل توجهی در بارگذاری تعادل ترافیک پهنای باند شبکه دارد. همچنین از آنجایی که آنها هیچ هدف تجاری خاصی ندارند؛ احتمالاً منبع بازترین مدلی هستند که تا به امروز در بازار دیده شده است. این ویژگیها، دیپسیک را بسیار چشمگیر و جالب میکند.
شرکت اوپنایآی مدعی است؛ شواهدی دارد که دیپسیک چین از مدل خود برای آموزش رقبای این شرکت در فیس بوک، ایکس و لینکدین، استفاده کرده است. سازنده چتجیپیتی، همچنین مدعی است که احتمال سرقت مالکیت معنوی، سرقت IP وجود دارد و بهعلاوه شواهدی از «تقطیر» در به موفقیت رسیدن دیپسیک به چشم میخورد. تقطیر در واقع، یک تکنیک مرسوم در اکوسیستم استارتاپی است که توسط توسعهدهندگان برای به دست آوردن عملکرد بهتر در مدلهای کوچکتر با استفاده از خروجیهای مدلهای بزرگتر و تواناتر مورد استفاده قرار میگیرد و به آنها اجازه میدهد تا نتایج مشابهی را در کارهای خاص با هزینه بسیار کمتر به دست آورند و علاوه بر این کار که به نوعی سرقت و درز اطلاعات محسوب میشود؛ کاربران مدل کوچکتر عملا نمیتوانند هیچ یک از خدمات آن را کپی کنند یا از خروجی آن برای توسعه مدلهایی که با اوپنایآی رقابت میکند؛ استفاده کنند.
کارشناسان معتقدند که استفاده از خروجیهای شرکت اوپنایآی که روی استخدام افرادی سرمایهگذاری کردهاست تا به مدلهایشان بیاموزند که چگونه پاسخهایی را تولید کنند که به نظر انسانیتر میآیند؛ برای آزمایشگاههای هوش مصنوعی در چین و آمریکا معمول است. و شواهد حاکی از آن است که این کار، یک روش بسیار رایج برای استارتآپها و دانشگاهیان است که از خروجیهای LLM تجاری همسو با انسان، مانند چتجیپیتی ، برای آموزش مدل دیگری استفاده کنند.همچنین شواهد حاکی از آن است که دیپسیک از 2048 کارت گرافیک Nvidia H800 استفاده کرده و 5.6 میلیون دلار برای آموزش مدل V3 خود با 671 میلیارد پارامتر هزینه کرده است که کسری از هزینههای شرکت اوپنایآی و گوگل برای آموزش مدلهایی با اندازه مشابه است. برخی از کارشناسان گفتند که این مدل پاسخهایی ایجاد میکند که نشان میدهد بر روی خروجیهای اوپنایآی GPT-4 آموزش دیده است که شرایط خدمات آن را نقض میکند.
تبلیغات متنی
جدیدترین اخبار
برخورد ۴ خودروی سواری در محورهای بندرعباس ۱۱ مصدوم برجا گذاشت
آلبوم «بدرقه» در تشییع رهبر شهید با صدای هفت خواننده تولید شد/علیرضا افتخاری تا پرواز همای
پخش مجموعه نمایشی «دیدار» درباره رهبر شهید از قاب شبکه یک سیما
خدمات درمانی، بهداشتی و اسکان ۲۵۰۰ زائر در مراسم تشییع رهبر شهید فراهم شد
برنامه بازی های امشب جام جهانی ۲۰۲۶/ دیدار آرژانتین با شگفتی جام
بلومبرگ: اروپا پرداخت عوارض تنگه هرمز به ایران و عمان را قطعی میداند
تکذیب ادعاهای مطرح شده از زبان فرماندهی انتظامی کشور
افزایش ظرفیت عرضه سوخت در مسیرهای منتهی به مراسم تشییع
ادای احترام رئیس قوه قضاییه به پیکر رهبر شهید انقلاب
کدام مقامات و شخصیتهای برجسته لبنانی در مراسم «وداع رهبر شهید» حضور یافتند؟
برگزاری مسابقات به مناسبت گرامیداشت شهدای پرواز ۶۵۵
رقابتهای انتخابی تیم جودوی بانوان هرمزگان
نمایش تصاویر کودکان شهید میناب و شهدای ناو دنا در «خیمه هنر»
آمادهسازی ظرفیت اسکان بیش از ۷۰ هزار زائر مراسم بدرقه رهبر
دیدار مقامات شرکتکننده در آیین بدرقه آقای شهید ایران با رئیسجمهور