اوپن ایآی میگوید شواهدی یافته است که نشان میدهد استارتآپ هوش مصنوعی چینی دیپسیک از مدلهای اختصاصی این شرکت آمریکایی برای آموزش رقیب منبع باز خود استفاده کرده است، زیرا نگرانیها در مورد نقض احتمالی مالکیت معنوی افزایش مییابد.
سازنده چتبات ChatGPT مستقر در سانفرانسیسکو به فایننشال تایمز گفت که شواهدی از "تقطیر" مشاهده کرده است، که گمان می رود از دیپسیک باشد.
این تکنیک توسط توسعه دهندگان برای دستیابی به عملکرد بهتر در مدل های کوچکتر با استفاده از خروجی های مدل های بزرگتر و توانمندتر استفاده می شود، که به آنها امکان می دهد به نتایج مشابهی در وظایف خاص با هزینه بسیار کمتری دست یابند.
تقطیر یک روش رایج در صنعت است، اما نگرانی این بود که دیپسیک ممکن است آن را برای ساختن مدل رقیب خود انجام دهد، که نقض شرایط خدمات اوپن ایآی است.
یکی از افراد نزدیک به اوپن ایآی گفت: "مسئله این است که وقتی شما [آن را از پلتفرم خارج میکنید و] آن را برای ایجاد مدل خودتان برای اهداف خود انجام میدهید."
اوپن ایآی از اظهار نظر بیشتر یا ارائه جزئیات شواهد خود خودداری کرد. شرایط خدمات آن بیان می کند که کاربران نمی توانند هیچ یک از خدمات آن را "کپی" کنند یا "از خروجی برای توسعه مدل هایی که با اوپن ایآی رقابت می کنند" استفاده کنند.
انتشار مدل استدلال R1 توسط دیپسیک بازارها، و همچنین سرمایه گذاران و شرکت های فناوری در سیلیکون ولی را شگفت زده کرده است. مدل های ساخته شده با بودجه محدود آن به رتبه های بالایی رسیده اند و نتایج قابل مقایسه ای با مدل های پیشرو آمریکایی کسب کرده اند.
سهام انویدیا روز دوشنبه 17 درصد سقوط کرد و 589 میلیارد دلار از ارزش بازار آن کاسته شد، به دلیل ترس از اینکه سرمایه گذاری های بزرگ در سخت افزار گران قیمت هوش مصنوعی آن ممکن است مورد نیاز نباشد. آنها روز سه شنبه به همراه سایر سهام های فناوری 9 درصد بهبود یافتند.
اوپن ایآی و شریک آن مایکروسافت سال گذشته حساب هایی را که گمان می رفت متعلق به دیپسیک باشند و از رابط برنامه نویسی کاربردی (API) اوپن ایآی استفاده می کردند، مورد بررسی قرار دادند و دسترسی آنها را به دلیل مشکوک بودن به تقطیر که نقض شرایط خدمات بود، مسدود کردند، فرد دیگری با دانش مستقیم گفت. این تحقیقات برای اولین بار توسط بلومبرگ گزارش شد.
مایکروسافت از اظهار نظر خودداری کرد و اوپن ایآی بلافاصله به درخواست برای اظهار نظر در مورد این جزئیات پاسخ نداد. دیپسیک به درخواست برای اظهار نظر که در طول تعطیلات سال نو قمری انجام شد، پاسخ نداد.
پیش از این، دیوید ساکس، تزار هوش مصنوعی و ارزهای دیجیتال رئیس جمهور دونالد ترامپ گفت که "امکان دارد" سرقت مالکیت معنوی رخ داده باشد.
ساکس روز سه شنبه به فاکس نیوز گفت: "تکنیکی در هوش مصنوعی به نام تقطیر وجود دارد... که در آن یک مدل از مدل دیگر یاد می گیرد [و] نوعی دانش را از مدل والد می مکد."
ساکس افزود: "و شواهد قابل توجهی وجود دارد که نشان می دهد کاری که دیپسیک در اینجا انجام داده است، این است که آنها دانش را از مدل های اوپن ایآی تقطیر کرده اند و من فکر نمی کنم اوپن ایآی از این موضوع بسیار خوشحال باشد"، اگرچه او شواهدی ارائه نکرد.
دیپسیک گفت که تنها از 2048 کارت گرافیک انویدیا H800 استفاده کرده و 5.6 میلیون دلار برای آموزش مدل V3 خود با 671 میلیارد پارامتر هزینه کرده است، کسری از آنچه اوپن ایآی و گوگل برای آموزش مدل های با اندازه قابل مقایسه هزینه کرده اند. برخی از کارشناسان گفتند که این مدل پاسخ هایی ایجاد کرده است که نشان می دهد بر اساس خروجی های GPT-4 اوپن ایآی آموزش دیده است که این امر نقض شرایط خدمات آن است.
دست اندرکاران صنعت می گویند که این یک روش معمول برای آزمایشگاه های هوش مصنوعی در چین و ایالات متحده است که از خروجی های شرکت هایی مانند اوپن ایآی استفاده می کنند، که برای استخدام افرادی برای آموزش مدل های خود برای تولید پاسخ هایی که بیشتر شبیه انسان به نظر می رسند، سرمایه گذاری کرده اند. این کار پرهزینه و فشرده است و بازیکنان کوچکتر اغلب از این کار استفاده می کنند.
ریتویک گوپتا، کاندیدای دکترا در هوش مصنوعی در دانشگاه کالیفرنیا، برکلی، گفت: "این یک روش بسیار رایج برای استارتآپها و دانشگاهیان است که از خروجیهای مدلهای زبان بزرگ تجاری همسو با انسان، مانند ChatGPT، برای آموزش مدل دیگری استفاده کنند."
وی افزود: "این بدان معناست که شما این مرحله بازخورد انسانی را به صورت رایگان دریافت می کنید. برای من تعجب آور نیست که دیپسیک ظاهراً همین کار را انجام می دهد. اگر آنها این کار را انجام می دادند، متوقف کردن این عمل دقیقاً ممکن است دشوار باشد."
این عمل، دشواری شرکتهایی را که مشتاق حفاظت از برتری فنی خود هستند، برجسته میکند. اوپن ایآی در آخرین بیانیه خود گفت: "ما میدانیم که شرکتهای مستقر در [چین] - و دیگران - دائماً در تلاشند تا مدلهای شرکتهای پیشرو هوش مصنوعی ایالات متحده را تقطیر کنند."
این شرکت افزود: "ما برای محافظت از مالکیت معنوی خود، از جمله یک فرآیند دقیق برای اینکه کدام قابلیتهای مرزی را در مدلهای منتشر شده قرار دهیم، اقدامات متقابلی انجام میدهیم و معتقدیم... که همکاری نزدیک با دولت ایالات متحده برای بهترین حفاظت از تواناترین مدل ها از تلاش های دشمنان و رقبا برای تصاحب فناوری ایالات متحده بسیار مهم است."
اوپن ایآی با اتهامات نقض حق چاپ خود از سوی روزنامهها و سازندگان محتوا، از جمله شکایتهای نیویورک تایمز و نویسندگان برجسته، که این شرکت را متهم میکنند که مدلهای خود را بر اساس مقالات و کتابهای آنها بدون اجازه آموزش داده است، میجنگد.