علم و فناوری
هوش مصنوعی جدید چینیها درست در آستانه انتشار آخرین گزارشات فصلی شرکتهای آمریکایی و همچنین چند روز مانده به سال نوی چینی طوفان به راه انداخت و باعث سقوط ارزش شرکتهای پیشروی هوش مصنوعی در آمریکا شد.
چراکه از یک سو شرکتهای غربی به دلیل قوانین سفت و سختی که در قبل از انتشار گزارشات فصلی خود دارند؛ امکان دفاع از خود را در برابر دیپسیک نداشتند و همگی در زمان رونمایی این هوش مصنوعی، مجبور به سکوت شدند. از طرفی به دلیل مقارن شدن این رونمایی با سال نوی چینی، رقبای داخلی چینی نیز از آن رو دست خوردند و این رونمایی منجر به تقلا در میان رقبای داخلی آن نظیر تیکتاک، علی بابا و ... برای ارتقاء مدلهای هوش مصنوعی خود آن هم در زمانی که کارمندان به استقبال تعطیلات رفته بودند؛ شد. به عبارتی دیگر، اتاق فکر دیپسیک با بهپا کردن این طوفان، همچون گردابی، بسیاری از رقبای داخلی و خارجی خود را با بحران مواجه کرد. بهطور مثال شرکتهای بزرگ فناوری چینی مانند علی بابا صدها هزار کارمند دارند اما دیپسیک مانند یک آزمایشگاه تحقیقاتی عمل میکند که عمدتاً از فارغ التحصیلان جوان و دانشجویان دکترا از دانشگاههای برتر چین تشکیل شده است. و این چابکی استارتاپ دیپسیک میتواند به سرعت سهم بازار شرکتهای بزرگ را محدودتر کند.
بسیاری از تحلیلگران بازارهای مالی از دیپسیک با عنوان قوی سیاه و یا لااقل قوی خاکستری یاد میکنند و معتقدند رونمایی آن به قدری شوکه کننده بود که به یکباره باعث ایجاد یک کرش در بازار سهام آمریکا، به عنوان بزرگترین اقتصاد دنیا شد. دیپسیک حدود یک تریلیون دلار از شاخص فناوری پیشرو در ایالات متحده را در یک هفته به دلیل ترس ناشی از عدم نیاز به سرمایه گذاریهای بزرگ در سخت افزار گران قیمت هوش مصنوعی، از بین برد؛ چراکه این هوش مصنوعی نوظهور، با هزینهای بسیار کمتر نسبت به مدلهای آمریکایی ساخته شده است.
دیپسیک یک استارتآپ و لابراتوار هوش مصنوعی است که در سال ۲۰۲۳ توسط تیمی از محققان چینی تأسیس شد. هدف اصلی این استارتاپ، توسعه مدلهای هوش مصنوعی با هزینهای بسیار کمتر و عملکردی قابلرقابت با شرکتهای بزرگ مانند اوپنایآی است. مدل R1 دیپسیک مبتنی بر معماری Transformer طراحی شده و از تکنیکهای یادگیری تقویتی چندمرحلهای استفاده میکند. یکی از ویژگیهای برجسته دیپسیک، استفاده از روش “خودآموزی پویا” است. برخلاف مدلهایی نظیر چتجیپیتی که برای بهروزرسانی نیازمند دادههای عظیم و بازآموزیهای مکرر هستند؛ دیپسیک میتواند با استفاده از دادههای جدید بهطور مداوم خود را بهروزرسانی کند. این روش به دیپسیک اجازه داده است تا با هزینهای کمتر از ۱۰ میلیون دلار، مدلی ارائه دهد که با مدلهای ۱۵۰ میلیارد دلاری رقابت میکند. لازم به توضیح است که مدل R1 بل انقلابی که در صنعت هوش مصنوعی ایجاد کرده است؛ علاوه بر شرکتهای فناوری آمریکایی، بهطور غیرمستقیم بر قیمت ارزهای دیجیتال، بهویژه بیتکوین، نیز تأثیر گذاشته است و منجر به کاهش قیمت آن شده است.
دیپسیک تیم توسعه بسیار جوانی دارد و در واقع یک آزمایشگاه است که هیچ فشاری برای تجاری سازی ندارد. لذا دانشجویانی که برای این پروژه کار میکنند؛ هیچ انتظار درآمدی ندارند و احتمالا در آینده هیچ تیم فروشی هم نداشته باشند و دانشگاهی بودن آن باعث میشود؛ مدل خود را بر اساس آخرین تحقیقات متن باز به سرعت بهبود ببخشند و این یعنی هرینه کم و بازدهی بالا. دیپسیک عملا با یک تیم حدودا 150 نفره موفق به ارائه چنین محصولی شده است.
دوم اینکه، دیپسیک احتمالاً از سال 2019، قبل از چتجیپیتی ، مرکز داده خود را راه اندازی کرده اند. این امر به آنها اجازه میدهد تا سرعت و کارایی الگوریتمهای معاملاتی را با سختافزار خریداری شده خود به حداکثر برسانند تا بیشترین بازده را برای صندوق داده خود داشته باشند. این موضوع منجر به بسیاری از نوآوریها، کشفها یا الگوهای جدید خواهد شد و بهینهسازی نرم افزار به سخت افزار تاثیر قابل توجهی در بارگذاری تعادل ترافیک پهنای باند شبکه دارد. همچنین از آنجایی که آنها هیچ هدف تجاری خاصی ندارند؛ احتمالاً منبع بازترین مدلی هستند که تا به امروز در بازار دیده شده است. این ویژگیها، دیپسیک را بسیار چشمگیر و جالب میکند.
شرکت اوپنایآی مدعی است؛ شواهدی دارد که دیپسیک چین از مدل خود برای آموزش رقبای این شرکت در فیس بوک، ایکس و لینکدین، استفاده کرده است. سازنده چتجیپیتی، همچنین مدعی است که احتمال سرقت مالکیت معنوی، سرقت IP وجود دارد و بهعلاوه شواهدی از «تقطیر» در به موفقیت رسیدن دیپسیک به چشم میخورد. تقطیر در واقع، یک تکنیک مرسوم در اکوسیستم استارتاپی است که توسط توسعهدهندگان برای به دست آوردن عملکرد بهتر در مدلهای کوچکتر با استفاده از خروجیهای مدلهای بزرگتر و تواناتر مورد استفاده قرار میگیرد و به آنها اجازه میدهد تا نتایج مشابهی را در کارهای خاص با هزینه بسیار کمتر به دست آورند و علاوه بر این کار که به نوعی سرقت و درز اطلاعات محسوب میشود؛ کاربران مدل کوچکتر عملا نمیتوانند هیچ یک از خدمات آن را کپی کنند یا از خروجی آن برای توسعه مدلهایی که با اوپنایآی رقابت میکند؛ استفاده کنند.
کارشناسان معتقدند که استفاده از خروجیهای شرکت اوپنایآی که روی استخدام افرادی سرمایهگذاری کردهاست تا به مدلهایشان بیاموزند که چگونه پاسخهایی را تولید کنند که به نظر انسانیتر میآیند؛ برای آزمایشگاههای هوش مصنوعی در چین و آمریکا معمول است. و شواهد حاکی از آن است که این کار، یک روش بسیار رایج برای استارتآپها و دانشگاهیان است که از خروجیهای LLM تجاری همسو با انسان، مانند چتجیپیتی ، برای آموزش مدل دیگری استفاده کنند.همچنین شواهد حاکی از آن است که دیپسیک از 2048 کارت گرافیک Nvidia H800 استفاده کرده و 5.6 میلیون دلار برای آموزش مدل V3 خود با 671 میلیارد پارامتر هزینه کرده است که کسری از هزینههای شرکت اوپنایآی و گوگل برای آموزش مدلهایی با اندازه مشابه است. برخی از کارشناسان گفتند که این مدل پاسخهایی ایجاد میکند که نشان میدهد بر روی خروجیهای اوپنایآی GPT-4 آموزش دیده است که شرایط خدمات آن را نقض میکند.
تگ ها:
اخبار مرتبط
امنیت «دیپسیک» خبرساز شد؛ از نحوه ساخت بمب تا هککردن دیتابیس دولتی!
هوش مصنوعی ارتقا یافته رد تقلبهای علمی را میزند؛ کپی برداری غیرممکن می شود؟
هوش مصنوعی، دوست یا رقیب؟
عربستان میزبان اولین المپیاد بینالمللی هوش مصنوعی شد
ربات دندانپزشک اولین انسان را درمان کرد
پربازدیدترین ها
مجموعه سازه گستر گامبرون
شرایط جدیدی برای دریافت کارت اعتباری سهام عدالت اعلام شده که براساس آن شش گروه از سهامداران نمیتوانند کارت اعتباری بگیرند.
مدیر فناوری اطلاعات و ارتباطات سازمان منطقه آزاد قشم از الکترونیکی شدن مراحل ثبت نام و تمدید کارت شهروندی قشم با هدف کاهش مراجعات حضوری برای کنترل بهتر و مقابله با شیوع ویروس کرونا در جزیره خبر داد.
نرخ کرایه حمل خودرو در مسیر پل - لافت برای سفر به جزیره قشم افزایش یافت.
با آغاز سال ۲۰۲۱ میلادی خدمات پیامرسان واتساپ برای میلیونها کاربری که از تلفنهای همراه قدیمی استفاده میکنند، متوقف خود خواهد شد.
جدیدترین اخبار
دانشجویان فردا با رهبر انقلاب دیدار میکنند