مجموعه‌های موزه برای بسیاری از محققان بسیار ارزشمند هستند. Miguel Habano/E+ via Getty Images
مجموعه‌های موزه برای بسیاری از محققان بسیار ارزشمند هستند. Miguel Habano/E+ via Getty Images

موزه‌ها داده‌های فراوانی دارند و هوش مصنوعی می‌تواند دسترسی به آن‌ها را آسان‌تر کند - اما استانداردسازی و سازماندهی آن در زمینه‌های مختلف آسان نخواهد بود

هسته‌های یخی در فریزرها، دایناسورها در نمایش، ماهی‌ها در شیشه‌ها، پرندگان در جعبه‌ها، بقایای انسانی و آثار باستانی از تمدن‌های از بین رفته که تعداد کمی از مردم آنها را می‌بینند - مجموعه‌های موزه مملو از همه اینها و موارد دیگر هستند.

این مجموعه‌ها گنجینه‌هایی هستند که تاریخ طبیعی و انسانی سیاره را بازگو می‌کنند و به دانشمندان در زمینه‌های مختلفی مانند زمین‌شناسی، دیرینه‌شناسی، مردم‌شناسی و غیره کمک می‌کنند. چیزی که در سفر به موزه می‌بینید تنها بخش کوچکی از شگفتی‌های موجود در مجموعه آنها است.

موزه‌ها عموماً می‌خواهند محتویات مجموعه‌های خود را به صورت فیزیکی یا دیجیتالی در دسترس معلمان و محققان قرار دهند. با این حال، کارکنان هر مجموعه روش خاص خود را برای سازماندهی داده‌ها دارند، بنابراین پیمایش در این مجموعه‌ها می‌تواند چالش‌برانگیز باشد.

ایجاد، سازماندهی و توزیع نسخه‌های دیجیتالی نمونه‌های موزه یا اطلاعات مربوط به اقلام فیزیکی در یک مجموعه، نیازمند حجم فوق‌العاده‌ای از داده است. و این داده‌ها می‌توانند در مدل‌های یادگیری ماشین یا سایر هوش مصنوعی برای پاسخ به سوالات بزرگ تغذیه شوند.

در حال حاضر، حتی در یک دامنه تحقیقاتی واحد، یافتن داده‌های مناسب نیازمند پیمایش در مخازن مختلف است. هوش مصنوعی می‌تواند به سازماندهی حجم زیادی از داده‌ها از مجموعه‌های مختلف کمک کند و اطلاعات را برای پاسخ به سوالات خاص بیرون بکشد.

اما استفاده از هوش مصنوعی یک راه حل کامل نیست. مجموعه‌ای از شیوه‌ها و سیستم‌های مشترک برای مدیریت داده‌ها بین موزه‌ها می‌تواند کیوریتوری و به اشتراک‌گذاری داده‌های لازم برای انجام کار هوش مصنوعی را بهبود بخشد. این شیوه‌ها می‌توانند به انسان‌ها و ماشین‌ها کمک کنند تا اکتشافات جدیدی را از این مجموعه‌های ارزشمند انجام دهند.

من به عنوان یک دانشمند اطلاعات که رویکردها و نظرات دانشمندان را در مورد مدیریت داده‌های تحقیق مطالعه می‌کنم، دیده‌ام که چگونه زیرساخت جمع‌آوری فیزیکی جهان یک تکه پارچه از اشیاء و فراداده‌های مرتبط با آنها است.

ابزارهای هوش مصنوعی می‌توانند کارهای شگفت‌انگیزی انجام دهند، مانند ساخت مدل‌های سه بعدی از نسخه‌های دیجیتالی شده اقلام در مجموعه‌های موزه، اما تنها در صورتی که داده‌های سازمان‌یافته کافی در مورد آن مورد در دسترس باشد. برای اینکه ببینیم هوش مصنوعی چگونه می‌تواند به مجموعه‌های موزه کمک کند، تیم تحقیقاتی من با انجام گروه‌های متمرکز با افرادی که مجموعه‌های موزه را مدیریت می‌کردند، شروع کرد. ما پرسیدیم که آنها چه کاری انجام می‌دهند تا مجموعه‌هایشان توسط انسان و هوش مصنوعی استفاده شود.

کودکی که به یک ویترین شیشه‌ای بزرگ نگاه می‌کند.
موزه‌ها می‌توانند مجموعه‌های وسیعی داشته باشند - از نمونه‌هایی از مکان‌های باستان‌شناسی گرفته تا حشرات نگهداری شده تا استخوان‌های دایناسور. و مجموعه‌های عظیم به معنای جمع آوری و سازماندهی داده‌های زیادی است. Justin Pumfrey/The Image Bank via Getty Images

مدیران مجموعه

هنگامی که یک مورد وارد مجموعه موزه می‌شود، مدیران مجموعه افرادی هستند که ویژگی‌های آن مورد را توصیف می‌کنند و داده‌هایی را در مورد آن تولید می‌کنند. آن داده‌ها، که فراداده نامیده می‌شوند، به دیگران اجازه می‌دهند تا از آن استفاده کنند و ممکن است مواردی مانند نام جمع‌آورنده، موقعیت جغرافیایی، زمان جمع‌آوری و در مورد نمونه‌های زمین‌شناسی، دوره‌ای که از آن آمده است را شامل شود. برای نمونه‌هایی از یک حیوان یا گیاه، ممکن است شامل طبقه‌بندی آن باشد، که مجموعه‌ای از نام‌های لاتین است که آن را طبقه‌بندی می‌کنند.

همه این اطلاعات با هم، حجم بسیار زیادی از داده‌ها را تشکیل می‌دهند.

اما ترکیب داده‌ها در دامنه‌های مختلف با استانداردهای مختلف واقعاً دشوار است. خوشبختانه، مدیران مجموعه در تلاش هستند تا فرآیندهای خود را در سراسر رشته‌ها و برای بسیاری از انواع نمونه‌ها استاندارد کنند. کمک‌های مالی به جوامع علمی کمک کرده است تا ابزارهایی برای استانداردسازی بسازند.

در مجموعه‌های زیستی، ابزار Specify به مدیران این امکان را می‌دهد تا به سرعت نمونه‌ها را با منوهای کشویی که از قبل با استانداردهایی برای طبقه‌بندی و سایر پارامترها برای توصیف مداوم نمونه‌های ورودی پر شده‌اند، طبقه‌بندی کنند.

یک استاندارد فراداده رایج در زیست‌شناسی Darwin Core است. فراداده‌ها و ابزارهای مشابه و تثبیت‌شده‌ای در سراسر علوم وجود دارد تا گردش کار گرفتن اقلام واقعی و قرار دادن آنها در یک دستگاه را تا حد امکان آسان کند.

ابزارهای ویژه مانند اینها و فراداده‌ها به مدیران مجموعه کمک می‌کنند تا داده‌های اشیاء خود را برای اهداف تحقیقاتی و آموزشی قابل استفاده مجدد کنند.

همه چیزهای کوچک

تیم من و من 10 گروه متمرکز با مجموع 32 شرکت کننده از چندین جامعه نمونه فیزیکی انجام دادیم. اینها شامل مدیران مجموعه در سراسر رشته‌ها، از جمله مردم‌شناسی، باستان‌شناسی، گیاه‌شناسی، زمین‌شناسی، ماهی‌شناسی، حشره‌شناسی، خزنده‌شناسی و دیرینه‌شناسی بود.

هر شرکت‌کننده به سؤالاتی درباره نحوه دسترسی، سازماندهی، ذخیره و استفاده از داده‌ها از مجموعه‌های خود در تلاش برای آماده سازی مطالب خود برای استفاده هوش مصنوعی پاسخ داد. در حالی که افراد انسانی باید رضایت خود را برای مطالعه ارائه دهند، اکثر گونه‌ها این کار را نمی‌کنند. بنابراین، یک هوش مصنوعی می‌تواند داده‌ها را از مجموعه‌های فیزیکی غیرانسانی بدون نگرانی در مورد حریم خصوصی یا رضایت جمع‌آوری و تجزیه و تحلیل کند.

ما دریافتیم که مدیران مجموعه از زمینه‌ها و مؤسسات مختلف، شیوه‌های مختلفی در هنگام آماده سازی مجموعه‌های فیزیکی خود برای هوش مصنوعی دارند. نتایج ما نشان می‌دهد که استانداردسازی انواع فراداده‌هایی که مدیران ثبت می‌کنند و نحوه ذخیره آنها در سراسر مجموعه‌ها می‌تواند اقلام موجود در این نمونه‌ها را در دسترس‌تر و قابل استفاده‌تر کند.

پروژه‌های تحقیقاتی اضافی مانند مطالعه ما می‌توانند به مدیران مجموعه کمک کنند تا زیرساخت‌هایی را که برای آماده‌سازی داده‌های خود برای ماشین نیاز دارند، بسازند. تخصص انسانی می‌تواند به اطلاع رسانی به ابزارهای هوش مصنوعی کمک کند که اکتشافات جدیدی را بر اساس گنجینه‌های قدیمی موجود در مجموعه‌های موزه انجام می‌دهند.