ایده‌ها: شتاب‌بخشی به تحقیقات مدل‌های پایه: هوش مصنوعی برای همه

پشت هر فناوری نوظهور، ایده‌ای بزرگ قرار دارد که آن را به پیش می‌راند. در مجموعه پادکست تحقیقاتی مایکروسافت با عنوان ایده‌ها، اعضای جامعه تحقیقاتی مایکروسافت درباره باورهایی که به تحقیقاتشان جان می‌بخشد، تجربیات و متفکرانی که الهام‌بخش آن‌ها هستند و تأثیر مثبت انسانی که هدف آن است، بحث می‌کنند.

در این قسمت، میزبان گرچن هویزینگا با سه پژوهشگر درباره برنامه شتاب‌بخشی به تحقیقات مدل‌های پایه (AFMR) (در برگه جدید باز می‌شود) صحبت می‌کند؛ یک شبکه تحقیقاتی جهانی و پلتفرم منابع که به اعضای جامعه دانشگاهی گسترده‌تر اجازه می‌دهد مرزهای مدل‌های پایه هوش مصنوعی را جابجا کرده و همکاری‌های هیجان‌انگیز و غیرمتعارف را در رشته‌ها و مؤسسات مختلف کاوش کنند. اولین ویگاس (در برگه جدید باز می‌شود)، مشاور فنی در تحقیقات مایکروسافت، دیدگاه خود را در مورد این برنامه از منظر مایکروسافت به اشتراک می‌گذارد، در حالی که سزار تورس (در برگه جدید باز می‌شود)، استادیار علوم کامپیوتر در دانشگاه تگزاس در آرلینگتون، و محمد ادریس (در برگه جدید باز می‌شود)، استادیار در دپارتمان‌های پزشکی و بهداشت عمومی در دانشکده پزشکی مورهاوس، داستان‌های خود را در مورد چگونگی کمک دسترسی به مدل‌های پایه پیشرفته به متخصصان خلاق برای یافتن الهام از محیط‌های فیزیکی و مجازی خود و همچنین دسترس‌پذیرتر کردن و هم‌خوان‌تر کردن فرهنگی اطلاعات بهداشتی مرتبط با سرطان، بیان می‌کنند. این سه نفر سفرهای تحقیقاتی خود، از جمله ناامیدی‌ها و آرزوها را بازگو کرده و توضیح می‌دهند که چگونه منابع AFMR فرصت‌های تحول‌آفرینی را برای مؤسسات خدمت‌رسان به اقلیت‌ها و جوامعی که به آنها خدمت می‌کنند، فراهم کرده است.

اولین ویگاس توضیح می‌دهد که AFMR برنامه‌ای است که دسترسی به مدل‌های پایه را فراهم می‌کند، اما همچنین یک شبکه جهانی از محققان است. هدف اصلی هنگام شروع این برنامه، اطمینان از در دسترس بودن هوش مصنوعی برای همه، و نه فقط برای عده‌ای معدود بود. شنیدن دیدگاه‌های همکاران دانشگاهی درباره اکتشافات و سؤالاتی که شاید حتی به ذهن مایکروسافت خطور نکرده بود، بسیار مهم بود.

سزار تورس اشاره می‌کند که برنامه AFMR به او امکان داده است تا چشم‌انداز خلاقیت را بهتر تجسم کند. این یک شمشیر دولبه است؛ زیرا ابزارهای هوش مصنوعی می‌توانند فرآیند خلاقیت را مختل کنند و کارها را آسان‌تر سازند. ایده بزرگ تورس، تفکر درباره ابزارهایی است که عمداً باعث کندی ما می‌شوند، اصطکاک، خطا و شکست دارند. او معتقد است که شاید ساده‌ترین مسیر، سودمندترین مسیر نباشد، بلکه مسیری که در آن بیشترین احساس رضایت یا عاملیت را داشته باشیم، ارجح است.

محمد ادریس بیان می‌کند که برنامه‌هایی مانند AFMR به محققان امکان می‌دهد تا خارج از چارچوب‌های مرسوم فکر کنند و بررسی کنند که چگونه این فناوری‌های نوظهور می‌توانند بهداشت عمومی را متحول سازند. این سؤال مطرح می‌شود که یک مدل زبانی بزرگ (LLM) واقعاً برای درک زمینه به چه چیزی نیاز دارد؟ به عقیده او، برای اولین بار، امکان دستیابی واقعی به ارتباطات بهداشتی شخصی‌سازی‌شده فراهم شده است.

گرچن هویزینگا، میزبان برنامه، از هر سه مهمان می‌خواهد تا داستان شکل‌گیری مسیر تحقیقاتی خود را به طور خلاصه بیان کنند و بگویند چه ایده بزرگ یا شخصیت الهام‌بخشی آن‌ها را به سمت کار فعلی‌شان سوق داده است.

سزار تورس کار خود را در مرز خلاقیت توصیف می‌کند، با تمرکز بر اینکه چگونه فناوری می‌تواند روش‌های ما برای تعامل با جهان و ایده‌هایمان را پشتیبانی یا تقویت کند. ریشه علاقه او به این حوزه به روزی بازمی‌گردد که در کودکی به محل کار پدرش، یک حسابدار در کارخانه‌ای مرزی (Maquiladora)، رفته بود. اگرچه کار حسابداران و مهندس شیمی کارخانه برایش جذاب نبود زیرا فرآیندهایشان پنهان بود، و کار مهندس فرآیند با فلز مذاب نیز به دلیل گرما و ماشین‌آلات دست‌نیافتنی به نظر می‌رسید، اما مشاهده مهارت یک کارگر خط تولید در باز کردن جعبه‌ها، او را شگفت‌زده کرد. هماهنگی کامل حرکات آن کارگر و استفاده‌اش از محیط و بدنش، تورس را به این فکر واداشت که اوج توانایی انسان را دیده است. از آن لحظه، او تصمیم گرفت نحوه کسب مهارت توسط افراد را مطالعه کند و دریافت که محیط و قابل مشاهده بودن فرآیند، نقشی حیاتی در کسب مهارت دارند. تمام کارهای بعدی او در جهت توسعه فناوری‌هایی بوده که به همه کمک کند مهارت کسب کنند.

محمد ادریس داستان متفاوتی دارد. او کار خود را در امور مالی و در یک صندوق پوشش ریسک آغاز کرد و قصد داشت در همین حوزه ادامه دهد. اما در دوره پسادکترای خود در مونترال، به بستگان دوری که برای پناهندگی آمده بودند، در روند کار کمک کرد. این تجربه به او نشان داد که فناوری چگونه می‌تواند به افراد کمک کند تا به خودشان کمک کنند. او متوجه شد که شرایط جهانی گاهی حقوق، کرامت و توانایی افراد برای مراقبت از خود را سلب می‌کند. اما دیدن کودکانی که تنها با یک تلفن می‌توانستند خانواده‌های خود را در یافتن سرپناه، ثبت‌نام در مدرسه و شروع زندگی جدید راهنمایی کنند، شگفت‌انگیز بود. این مشاهدات او را بر آن داشت تا با دوستانش تیمی میان‌رشته‌ای تشکیل دهد و نمونه اولیه‌ای از پلتفرمی به نام «عطار» را بسازد. این پلتفرم با استفاده از پردازش زبان طبیعی، به پناهجویان کمک می‌کرد تا نیازهای خود را بیان کنند، شرایطشان ارزیابی شود و یک چک‌لیست سفارشی برای دسترسی به منابع دریافت کنند. این تجربه او را به سمت ترکیب علم داده، هوش مصنوعی و تحقیقات مبتنی بر جامعه برای مطالعه نابرابری‌های سلامت سوق داد.

اولین ویگاس، به عنوان مشاور فنی در تحقیقات مایکروسافت، وظیفه خود را جستجوی ایده‌های جدید و شناسایی فرضیه‌های علمی بالقوه می‌داند. او به دنبال پرورش خط لوله سالمی برای سرمایه‌گذاری‌های بزرگ احتمالی است. کار او ترکیبی از "علم ظریف و هنر دقیق" است که با گفتگو و همکاری با محققان داخلی و جامعه تحقیقاتی خارجی پیش می‌رود. علاقه او به هوش مصنوعی و به ویژه زبان‌های طبیعی، ریشه در دوران کودکی و بزرگ شدن در محیطی چند زبانه دارد. مشاهده تفاوت اصطلاحات در زبان‌های مختلف (مانند "باران گربه‌ها و سگ‌ها می‌بارد" در انگلیسی در مقابل "باران طناب‌ها می‌بارد" در فرانسه) کنجکاوی او را برانگیخت. اگرچه در ریاضیات قوی بود، اما علاقه اصلی‌اش به منطق ریاضی و زبان‌شناسی بود که او را به سمت زبان‌شناسی محاسباتی و دریافت دکترا در این زمینه هدایت کرد. او بر اهمیت همکاری و ایجاد شبکه تأکید می‌کند و در اوایل کارش، با همکاری فرد دیگری، اولین کتاب در زمینه معناشناسی واژگانی محاسباتی را ویرایش کرد تا رویکردهای مختلف جهانی را گرد هم آورد. این جنبه شبکه‌سازی و همکاری، همچنان برای او و در توسعه برنامه AFMR اهمیت حیاتی دارد.

ویگاس در مورد برنامه "شتاب‌بخشی به تحقیقات مدل‌های پایه" (AFMR) توضیح می‌دهد که "مدل‌های پایه" به مدل‌هایی اطلاق می‌شود که بر روی داده‌های گسترده آموزش دیده‌اند و می‌توانند وظایف مختلفی را انجام دهند، از جمله مدل‌های زبانی بزرگ (LLM) و مدل‌های بینایی. این اصطلاح در استنفورد برای توصیف معماری جدید GPT ابداع شد. مایکروسافت ریسرچ سابقه طولانی در همکاری با جامعه تحقیقاتی خارجی دارد، از جمله برنامه آکادمیک مایکروسافت تورینگ که دسترسی به مدل‌های کوچک‌تر را فراهم می‌کرد. با ظهور ChatGPT در نوامبر ۲۰۲۲، نیاز به دسترسی گسترده‌تر به مدل‌های بزرگ‌تر مانند GPT-3 و GPT-4 و منابع محاسباتی لازم، آشکار شد. برنامه AFMR برای پاسخ به این نیاز و علاقه جامعه دانشگاهی شکل گرفت. هدف اصلی AFMR، فراهم کردن دسترسی به مدل‌های پایه و ایجاد یک شبکه جهانی از محققان بود تا اطمینان حاصل شود که هوش مصنوعی در دسترس همگان قرار گیرد و دیدگاه‌های متنوعی در مورد اکتشافات و چالش‌های این حوزه مطرح شود.

محمد ادریس به تجربه شخصی خود با مدل‌های اولیه GPT-3 اشاره می‌کند. در حالی که از قابلیت‌های آن شگفت‌زده شده بود، نگرانی‌هایی در مورد سوگیری‌های ذاتی این مدل‌ها نیز وجود داشت. او به تحقیقی اشاره می‌کند که نشان می‌داد اگر از مدل خواسته شود جمله‌ای مانند "دو مسلمان وارد یک بار شدند..." را کامل کند، در درصد بالایی از موارد، پاسخ‌ها حاوی خشونت بود. این موضوع او را به فکر واداشت که چگونه این فناوری‌های نوظهور ممکن است ناخواسته نابرابری‌های سلامت را تشدید کنند. او معتقد است اگر در بررسی عملکرد این مدل‌ها هدفمند نباشیم، احتمالاً علیرغم بهبود کلی سلامت، شاهد افزایش نابرابری‌ها خواهیم بود. مأموریت دانشکده پزشکی مورهاوس، که پیشگامی در ایجاد و پیشبرد عدالت در سلامت است، نیازمند راه‌حل‌های مقیاس‌پذیر، پایدار و از نظر فرهنگی متناسب با جوامع هدف است. از آنجایی که نمی‌توان به سادگی از مردم پرسید که چه نیازی به هوش مصنوعی دارند، رویکردی میان‌رشته‌ای و درک عمیق مشکلات مردم ضروری است. AFMR به تیم او امکان داده تا در مورد چگونگی تحول بهداشت عمومی از طریق این فناوری‌ها، به ویژه در زمینه دسترسی به اطلاعات، فکر کنند. آنها در حال مطالعه چگونگی دسترس‌پذیرتر کردن اطلاعات بهداشتی، فراتر از ساده‌سازی زبان به سطح خواندن پایین، هستند. این شامل بازنویسی اطلاعات با در نظر گرفتن زمینه فرهنگی، ایجاد اعتماد و درک نیازهای فردی و خانوادگی است. آنها از منابع محاسباتی AFMR برای ایجاد "مدل‌های شخصیت جامعه" استفاده می‌کنند تا نیازها و نگرانی‌های جوامع را درک کرده و راه‌حل‌های مبتنی بر هوش مصنوعی تولید کنند که اطلاعات صحیح را در زمان مناسب، به شیوه‌ای قابل فهم، قابل اعتماد و متناسب با فرهنگ ارائه دهند. این رویکرد همچنین به چالش‌های عملی دسترسی به مراقبت‌های بهداشتی مانند حمل و نقل و اعتماد به پزشک می‌پردازد و هدف آن دستیابی به ارتباطات بهداشتی واقعاً شخصی‌سازی‌شده است.

سزار تورس آزمایشگاه میان‌رشته‌ای خود، "آتلیه هیبرید" (The Hybrid Atelier)، را اداره می‌کند که به مطالعه تعامل انسان و کامپیوتر در شیوه‌های خلاقانه می‌پردازد. ایده اصلی کار او این است که انسان‌ها ذاتاً خلاق هستند و مسئله اصلی، محیطی است که به ما اجازه می‌دهد از خلاقیت خود استفاده کنیم. هدف، ساخت ابزارهایی (دیجیتال یا فیزیکی) است که به افراد امکان می‌دهد جهان را از دریچه‌ای متفاوت ببینند و از دیدگاه‌های منحصر به فرد خود بهره ببرند. آتلیه او شامل افرادی از رشته‌های مختلف مانند علوم اعصاب، رقص، نویسندگی و موسیقی است که با هم کار می‌کنند تا بفهمند چگونه فرآیندهای خلاقانه فردی می‌توانند تقویت شوند. خلاقیت، ستون فقرات تحقیق و نوآوری است و امکان رؤیاپردازی، تفکر درباره چیزهای ناموجود و ترکیب بینش‌ها برای حل مشکلات دشوار را فراهم می‌کند. بنابراین، پرورش خلاقیت در دانشجویان و عموم مردم برای مشارکت در نوآوری ضروری است. شیوه‌های هنری و طراحی ذاتاً معرفت‌شناختی هستند و به ما کمک می‌کنند خود و محیط اطرافمان را بهتر بشناسیم. ظهور هوش مصنوعی در این زمینه یک شمشیر دولبه است: از یک سو، ابزارهایی وجود دارند که امکان خلق سریع آثار را فراهم می‌کنند (از ایده تا خروجی در چند ثانیه)، که انقلابی در نحوه آفرینش است. از سوی دیگر، محیط (ابزار) می‌تواند عاملیت و اقتدار زیادی بر فرد خلاق داشته باشد. اگر هوش مصنوعی کار را بیش از حد آسان کند، فرصت کمتری برای خلاقیت واقعی وجود خواهد داشت، زیرا محیط دیگر اصطکاک لازم را ایجاد نمی‌کند. برنامه AFMR به تورس کمک کرده تا چشم‌انداز خلاقیت را بهتر ببیند. ایده بزرگ او ساخت ابزارهایی است که عمداً کندتر عمل می‌کنند، دارای اصطکاک، خطا و شکست هستند، با این فرض که ساده‌ترین مسیر همیشه بهترین نیست و مسیرهایی که حس رضایت و عاملیت بیشتری می‌دهند، ارجح‌ترند. هدف، ساخت ابزارهایی است که به ما امکان می‌دهد "متفاوت ببینیم". این امر مستلزم درک ماهیت دیدن و ادراک است. چالش این است که چگونه از هوش مصنوعی به گونه‌ای استفاده کنیم که نه ابزار، بلکه تعامل بین ابزار و فرد بهینه شود. همانطور که تسلط بر یک قلم‌مو یا ساز موسیقی نیاز به تمرین و ایجاد رابطه با ابزار دارد، تعامل خلاقانه با هوش مصنوعی نیز نیازمند درک عمیق‌تر این رابطه است.

تورس به قیاس عکاسی آنالوگ اشاره می‌کند که در آن عکاس درگیر فرآیندهای بیشتری مانند تنظیم دیافراگم، نوردهی، و ظهور فیلم بود، در حالی که عکاسی دیجیتال اغلب به یک "کلیک" خلاصه می‌شود. این سهولت باعث می‌شود بسیاری از جنبه‌های فرآیند، از جمله زمان لازم برای یادگیری، زیرساخت‌ها (اتاق تاریک، مواد شیمیایی) و ملاحظات اخلاقی و کار خلاقانه، پنهان بمانند. اگر همیشه فقط دکمه را فشار دهیم، بخش مهمی از جنبه انسانی خلاقیت را از دست می‌دهیم.

ادریس با این دیدگاه موافق است و بر اهمیت افرادی که این مدل‌ها را ایجاد و تنظیم می‌کنند، تأکید دارد. اگر این افراد نماینده کل جامعه نباشند، خروجی مدل‌ها نیز منعکس‌کننده واقعیت نخواهد بود و برای همه مفید واقع نخواهد شد؛ این همان مفهوم "آشغال ورودی، آشغال خروجی" است.