پشت هر فناوری نوظهور، ایدهای بزرگ قرار دارد که آن را به پیش میراند. در مجموعه پادکست تحقیقاتی مایکروسافت با عنوان ایدهها، اعضای جامعه تحقیقاتی مایکروسافت درباره باورهایی که به تحقیقاتشان جان میبخشد، تجربیات و متفکرانی که الهامبخش آنها هستند و تأثیر مثبت انسانی که هدف آن است، بحث میکنند.
در این قسمت، میزبان گرچن هویزینگا با سه پژوهشگر درباره برنامه شتاببخشی به تحقیقات مدلهای پایه (AFMR) (در برگه جدید باز میشود) صحبت میکند؛ یک شبکه تحقیقاتی جهانی و پلتفرم منابع که به اعضای جامعه دانشگاهی گستردهتر اجازه میدهد مرزهای مدلهای پایه هوش مصنوعی را جابجا کرده و همکاریهای هیجانانگیز و غیرمتعارف را در رشتهها و مؤسسات مختلف کاوش کنند. اولین ویگاس (در برگه جدید باز میشود)، مشاور فنی در تحقیقات مایکروسافت، دیدگاه خود را در مورد این برنامه از منظر مایکروسافت به اشتراک میگذارد، در حالی که سزار تورس (در برگه جدید باز میشود)، استادیار علوم کامپیوتر در دانشگاه تگزاس در آرلینگتون، و محمد ادریس (در برگه جدید باز میشود)، استادیار در دپارتمانهای پزشکی و بهداشت عمومی در دانشکده پزشکی مورهاوس، داستانهای خود را در مورد چگونگی کمک دسترسی به مدلهای پایه پیشرفته به متخصصان خلاق برای یافتن الهام از محیطهای فیزیکی و مجازی خود و همچنین دسترسپذیرتر کردن و همخوانتر کردن فرهنگی اطلاعات بهداشتی مرتبط با سرطان، بیان میکنند. این سه نفر سفرهای تحقیقاتی خود، از جمله ناامیدیها و آرزوها را بازگو کرده و توضیح میدهند که چگونه منابع AFMR فرصتهای تحولآفرینی را برای مؤسسات خدمترسان به اقلیتها و جوامعی که به آنها خدمت میکنند، فراهم کرده است.
اولین ویگاس توضیح میدهد که AFMR برنامهای است که دسترسی به مدلهای پایه را فراهم میکند، اما همچنین یک شبکه جهانی از محققان است. هدف اصلی هنگام شروع این برنامه، اطمینان از در دسترس بودن هوش مصنوعی برای همه، و نه فقط برای عدهای معدود بود. شنیدن دیدگاههای همکاران دانشگاهی درباره اکتشافات و سؤالاتی که شاید حتی به ذهن مایکروسافت خطور نکرده بود، بسیار مهم بود.
سزار تورس اشاره میکند که برنامه AFMR به او امکان داده است تا چشمانداز خلاقیت را بهتر تجسم کند. این یک شمشیر دولبه است؛ زیرا ابزارهای هوش مصنوعی میتوانند فرآیند خلاقیت را مختل کنند و کارها را آسانتر سازند. ایده بزرگ تورس، تفکر درباره ابزارهایی است که عمداً باعث کندی ما میشوند، اصطکاک، خطا و شکست دارند. او معتقد است که شاید سادهترین مسیر، سودمندترین مسیر نباشد، بلکه مسیری که در آن بیشترین احساس رضایت یا عاملیت را داشته باشیم، ارجح است.
محمد ادریس بیان میکند که برنامههایی مانند AFMR به محققان امکان میدهد تا خارج از چارچوبهای مرسوم فکر کنند و بررسی کنند که چگونه این فناوریهای نوظهور میتوانند بهداشت عمومی را متحول سازند. این سؤال مطرح میشود که یک مدل زبانی بزرگ (LLM) واقعاً برای درک زمینه به چه چیزی نیاز دارد؟ به عقیده او، برای اولین بار، امکان دستیابی واقعی به ارتباطات بهداشتی شخصیسازیشده فراهم شده است.
گرچن هویزینگا، میزبان برنامه، از هر سه مهمان میخواهد تا داستان شکلگیری مسیر تحقیقاتی خود را به طور خلاصه بیان کنند و بگویند چه ایده بزرگ یا شخصیت الهامبخشی آنها را به سمت کار فعلیشان سوق داده است.
سزار تورس کار خود را در مرز خلاقیت توصیف میکند، با تمرکز بر اینکه چگونه فناوری میتواند روشهای ما برای تعامل با جهان و ایدههایمان را پشتیبانی یا تقویت کند. ریشه علاقه او به این حوزه به روزی بازمیگردد که در کودکی به محل کار پدرش، یک حسابدار در کارخانهای مرزی (Maquiladora)، رفته بود. اگرچه کار حسابداران و مهندس شیمی کارخانه برایش جذاب نبود زیرا فرآیندهایشان پنهان بود، و کار مهندس فرآیند با فلز مذاب نیز به دلیل گرما و ماشینآلات دستنیافتنی به نظر میرسید، اما مشاهده مهارت یک کارگر خط تولید در باز کردن جعبهها، او را شگفتزده کرد. هماهنگی کامل حرکات آن کارگر و استفادهاش از محیط و بدنش، تورس را به این فکر واداشت که اوج توانایی انسان را دیده است. از آن لحظه، او تصمیم گرفت نحوه کسب مهارت توسط افراد را مطالعه کند و دریافت که محیط و قابل مشاهده بودن فرآیند، نقشی حیاتی در کسب مهارت دارند. تمام کارهای بعدی او در جهت توسعه فناوریهایی بوده که به همه کمک کند مهارت کسب کنند.
محمد ادریس داستان متفاوتی دارد. او کار خود را در امور مالی و در یک صندوق پوشش ریسک آغاز کرد و قصد داشت در همین حوزه ادامه دهد. اما در دوره پسادکترای خود در مونترال، به بستگان دوری که برای پناهندگی آمده بودند، در روند کار کمک کرد. این تجربه به او نشان داد که فناوری چگونه میتواند به افراد کمک کند تا به خودشان کمک کنند. او متوجه شد که شرایط جهانی گاهی حقوق، کرامت و توانایی افراد برای مراقبت از خود را سلب میکند. اما دیدن کودکانی که تنها با یک تلفن میتوانستند خانوادههای خود را در یافتن سرپناه، ثبتنام در مدرسه و شروع زندگی جدید راهنمایی کنند، شگفتانگیز بود. این مشاهدات او را بر آن داشت تا با دوستانش تیمی میانرشتهای تشکیل دهد و نمونه اولیهای از پلتفرمی به نام «عطار» را بسازد. این پلتفرم با استفاده از پردازش زبان طبیعی، به پناهجویان کمک میکرد تا نیازهای خود را بیان کنند، شرایطشان ارزیابی شود و یک چکلیست سفارشی برای دسترسی به منابع دریافت کنند. این تجربه او را به سمت ترکیب علم داده، هوش مصنوعی و تحقیقات مبتنی بر جامعه برای مطالعه نابرابریهای سلامت سوق داد.
اولین ویگاس، به عنوان مشاور فنی در تحقیقات مایکروسافت، وظیفه خود را جستجوی ایدههای جدید و شناسایی فرضیههای علمی بالقوه میداند. او به دنبال پرورش خط لوله سالمی برای سرمایهگذاریهای بزرگ احتمالی است. کار او ترکیبی از "علم ظریف و هنر دقیق" است که با گفتگو و همکاری با محققان داخلی و جامعه تحقیقاتی خارجی پیش میرود. علاقه او به هوش مصنوعی و به ویژه زبانهای طبیعی، ریشه در دوران کودکی و بزرگ شدن در محیطی چند زبانه دارد. مشاهده تفاوت اصطلاحات در زبانهای مختلف (مانند "باران گربهها و سگها میبارد" در انگلیسی در مقابل "باران طنابها میبارد" در فرانسه) کنجکاوی او را برانگیخت. اگرچه در ریاضیات قوی بود، اما علاقه اصلیاش به منطق ریاضی و زبانشناسی بود که او را به سمت زبانشناسی محاسباتی و دریافت دکترا در این زمینه هدایت کرد. او بر اهمیت همکاری و ایجاد شبکه تأکید میکند و در اوایل کارش، با همکاری فرد دیگری، اولین کتاب در زمینه معناشناسی واژگانی محاسباتی را ویرایش کرد تا رویکردهای مختلف جهانی را گرد هم آورد. این جنبه شبکهسازی و همکاری، همچنان برای او و در توسعه برنامه AFMR اهمیت حیاتی دارد.
ویگاس در مورد برنامه "شتاببخشی به تحقیقات مدلهای پایه" (AFMR) توضیح میدهد که "مدلهای پایه" به مدلهایی اطلاق میشود که بر روی دادههای گسترده آموزش دیدهاند و میتوانند وظایف مختلفی را انجام دهند، از جمله مدلهای زبانی بزرگ (LLM) و مدلهای بینایی. این اصطلاح در استنفورد برای توصیف معماری جدید GPT ابداع شد. مایکروسافت ریسرچ سابقه طولانی در همکاری با جامعه تحقیقاتی خارجی دارد، از جمله برنامه آکادمیک مایکروسافت تورینگ که دسترسی به مدلهای کوچکتر را فراهم میکرد. با ظهور ChatGPT در نوامبر ۲۰۲۲، نیاز به دسترسی گستردهتر به مدلهای بزرگتر مانند GPT-3 و GPT-4 و منابع محاسباتی لازم، آشکار شد. برنامه AFMR برای پاسخ به این نیاز و علاقه جامعه دانشگاهی شکل گرفت. هدف اصلی AFMR، فراهم کردن دسترسی به مدلهای پایه و ایجاد یک شبکه جهانی از محققان بود تا اطمینان حاصل شود که هوش مصنوعی در دسترس همگان قرار گیرد و دیدگاههای متنوعی در مورد اکتشافات و چالشهای این حوزه مطرح شود.
محمد ادریس به تجربه شخصی خود با مدلهای اولیه GPT-3 اشاره میکند. در حالی که از قابلیتهای آن شگفتزده شده بود، نگرانیهایی در مورد سوگیریهای ذاتی این مدلها نیز وجود داشت. او به تحقیقی اشاره میکند که نشان میداد اگر از مدل خواسته شود جملهای مانند "دو مسلمان وارد یک بار شدند..." را کامل کند، در درصد بالایی از موارد، پاسخها حاوی خشونت بود. این موضوع او را به فکر واداشت که چگونه این فناوریهای نوظهور ممکن است ناخواسته نابرابریهای سلامت را تشدید کنند. او معتقد است اگر در بررسی عملکرد این مدلها هدفمند نباشیم، احتمالاً علیرغم بهبود کلی سلامت، شاهد افزایش نابرابریها خواهیم بود. مأموریت دانشکده پزشکی مورهاوس، که پیشگامی در ایجاد و پیشبرد عدالت در سلامت است، نیازمند راهحلهای مقیاسپذیر، پایدار و از نظر فرهنگی متناسب با جوامع هدف است. از آنجایی که نمیتوان به سادگی از مردم پرسید که چه نیازی به هوش مصنوعی دارند، رویکردی میانرشتهای و درک عمیق مشکلات مردم ضروری است. AFMR به تیم او امکان داده تا در مورد چگونگی تحول بهداشت عمومی از طریق این فناوریها، به ویژه در زمینه دسترسی به اطلاعات، فکر کنند. آنها در حال مطالعه چگونگی دسترسپذیرتر کردن اطلاعات بهداشتی، فراتر از سادهسازی زبان به سطح خواندن پایین، هستند. این شامل بازنویسی اطلاعات با در نظر گرفتن زمینه فرهنگی، ایجاد اعتماد و درک نیازهای فردی و خانوادگی است. آنها از منابع محاسباتی AFMR برای ایجاد "مدلهای شخصیت جامعه" استفاده میکنند تا نیازها و نگرانیهای جوامع را درک کرده و راهحلهای مبتنی بر هوش مصنوعی تولید کنند که اطلاعات صحیح را در زمان مناسب، به شیوهای قابل فهم، قابل اعتماد و متناسب با فرهنگ ارائه دهند. این رویکرد همچنین به چالشهای عملی دسترسی به مراقبتهای بهداشتی مانند حمل و نقل و اعتماد به پزشک میپردازد و هدف آن دستیابی به ارتباطات بهداشتی واقعاً شخصیسازیشده است.
سزار تورس آزمایشگاه میانرشتهای خود، "آتلیه هیبرید" (The Hybrid Atelier)، را اداره میکند که به مطالعه تعامل انسان و کامپیوتر در شیوههای خلاقانه میپردازد. ایده اصلی کار او این است که انسانها ذاتاً خلاق هستند و مسئله اصلی، محیطی است که به ما اجازه میدهد از خلاقیت خود استفاده کنیم. هدف، ساخت ابزارهایی (دیجیتال یا فیزیکی) است که به افراد امکان میدهد جهان را از دریچهای متفاوت ببینند و از دیدگاههای منحصر به فرد خود بهره ببرند. آتلیه او شامل افرادی از رشتههای مختلف مانند علوم اعصاب، رقص، نویسندگی و موسیقی است که با هم کار میکنند تا بفهمند چگونه فرآیندهای خلاقانه فردی میتوانند تقویت شوند. خلاقیت، ستون فقرات تحقیق و نوآوری است و امکان رؤیاپردازی، تفکر درباره چیزهای ناموجود و ترکیب بینشها برای حل مشکلات دشوار را فراهم میکند. بنابراین، پرورش خلاقیت در دانشجویان و عموم مردم برای مشارکت در نوآوری ضروری است. شیوههای هنری و طراحی ذاتاً معرفتشناختی هستند و به ما کمک میکنند خود و محیط اطرافمان را بهتر بشناسیم. ظهور هوش مصنوعی در این زمینه یک شمشیر دولبه است: از یک سو، ابزارهایی وجود دارند که امکان خلق سریع آثار را فراهم میکنند (از ایده تا خروجی در چند ثانیه)، که انقلابی در نحوه آفرینش است. از سوی دیگر، محیط (ابزار) میتواند عاملیت و اقتدار زیادی بر فرد خلاق داشته باشد. اگر هوش مصنوعی کار را بیش از حد آسان کند، فرصت کمتری برای خلاقیت واقعی وجود خواهد داشت، زیرا محیط دیگر اصطکاک لازم را ایجاد نمیکند. برنامه AFMR به تورس کمک کرده تا چشمانداز خلاقیت را بهتر ببیند. ایده بزرگ او ساخت ابزارهایی است که عمداً کندتر عمل میکنند، دارای اصطکاک، خطا و شکست هستند، با این فرض که سادهترین مسیر همیشه بهترین نیست و مسیرهایی که حس رضایت و عاملیت بیشتری میدهند، ارجحترند. هدف، ساخت ابزارهایی است که به ما امکان میدهد "متفاوت ببینیم". این امر مستلزم درک ماهیت دیدن و ادراک است. چالش این است که چگونه از هوش مصنوعی به گونهای استفاده کنیم که نه ابزار، بلکه تعامل بین ابزار و فرد بهینه شود. همانطور که تسلط بر یک قلممو یا ساز موسیقی نیاز به تمرین و ایجاد رابطه با ابزار دارد، تعامل خلاقانه با هوش مصنوعی نیز نیازمند درک عمیقتر این رابطه است.
تورس به قیاس عکاسی آنالوگ اشاره میکند که در آن عکاس درگیر فرآیندهای بیشتری مانند تنظیم دیافراگم، نوردهی، و ظهور فیلم بود، در حالی که عکاسی دیجیتال اغلب به یک "کلیک" خلاصه میشود. این سهولت باعث میشود بسیاری از جنبههای فرآیند، از جمله زمان لازم برای یادگیری، زیرساختها (اتاق تاریک، مواد شیمیایی) و ملاحظات اخلاقی و کار خلاقانه، پنهان بمانند. اگر همیشه فقط دکمه را فشار دهیم، بخش مهمی از جنبه انسانی خلاقیت را از دست میدهیم.
ادریس با این دیدگاه موافق است و بر اهمیت افرادی که این مدلها را ایجاد و تنظیم میکنند، تأکید دارد. اگر این افراد نماینده کل جامعه نباشند، خروجی مدلها نیز منعکسکننده واقعیت نخواهد بود و برای همه مفید واقع نخواهد شد؛ این همان مفهوم "آشغال ورودی، آشغال خروجی" است.