هستههای یخی در فریزرها، دایناسورها در نمایش، ماهیها در شیشهها، پرندگان در جعبهها، بقایای انسانی و آثار باستانی از تمدنهای از بین رفته که تعداد کمی از مردم آنها را میبینند - مجموعههای موزه مملو از همه اینها و موارد دیگر هستند.
این مجموعهها گنجینههایی هستند که تاریخ طبیعی و انسانی سیاره را بازگو میکنند و به دانشمندان در زمینههای مختلفی مانند زمینشناسی، دیرینهشناسی، مردمشناسی و غیره کمک میکنند. چیزی که در سفر به موزه میبینید تنها بخش کوچکی از شگفتیهای موجود در مجموعه آنها است.
موزهها عموماً میخواهند محتویات مجموعههای خود را به صورت فیزیکی یا دیجیتالی در دسترس معلمان و محققان قرار دهند. با این حال، کارکنان هر مجموعه روش خاص خود را برای سازماندهی دادهها دارند، بنابراین پیمایش در این مجموعهها میتواند چالشبرانگیز باشد.
ایجاد، سازماندهی و توزیع نسخههای دیجیتالی نمونههای موزه یا اطلاعات مربوط به اقلام فیزیکی در یک مجموعه، نیازمند حجم فوقالعادهای از داده است. و این دادهها میتوانند در مدلهای یادگیری ماشین یا سایر هوش مصنوعی برای پاسخ به سوالات بزرگ تغذیه شوند.
در حال حاضر، حتی در یک دامنه تحقیقاتی واحد، یافتن دادههای مناسب نیازمند پیمایش در مخازن مختلف است. هوش مصنوعی میتواند به سازماندهی حجم زیادی از دادهها از مجموعههای مختلف کمک کند و اطلاعات را برای پاسخ به سوالات خاص بیرون بکشد.
اما استفاده از هوش مصنوعی یک راه حل کامل نیست. مجموعهای از شیوهها و سیستمهای مشترک برای مدیریت دادهها بین موزهها میتواند کیوریتوری و به اشتراکگذاری دادههای لازم برای انجام کار هوش مصنوعی را بهبود بخشد. این شیوهها میتوانند به انسانها و ماشینها کمک کنند تا اکتشافات جدیدی را از این مجموعههای ارزشمند انجام دهند.
من به عنوان یک دانشمند اطلاعات که رویکردها و نظرات دانشمندان را در مورد مدیریت دادههای تحقیق مطالعه میکنم، دیدهام که چگونه زیرساخت جمعآوری فیزیکی جهان یک تکه پارچه از اشیاء و فرادادههای مرتبط با آنها است.
ابزارهای هوش مصنوعی میتوانند کارهای شگفتانگیزی انجام دهند، مانند ساخت مدلهای سه بعدی از نسخههای دیجیتالی شده اقلام در مجموعههای موزه، اما تنها در صورتی که دادههای سازمانیافته کافی در مورد آن مورد در دسترس باشد. برای اینکه ببینیم هوش مصنوعی چگونه میتواند به مجموعههای موزه کمک کند، تیم تحقیقاتی من با انجام گروههای متمرکز با افرادی که مجموعههای موزه را مدیریت میکردند، شروع کرد. ما پرسیدیم که آنها چه کاری انجام میدهند تا مجموعههایشان توسط انسان و هوش مصنوعی استفاده شود.
مدیران مجموعه
هنگامی که یک مورد وارد مجموعه موزه میشود، مدیران مجموعه افرادی هستند که ویژگیهای آن مورد را توصیف میکنند و دادههایی را در مورد آن تولید میکنند. آن دادهها، که فراداده نامیده میشوند، به دیگران اجازه میدهند تا از آن استفاده کنند و ممکن است مواردی مانند نام جمعآورنده، موقعیت جغرافیایی، زمان جمعآوری و در مورد نمونههای زمینشناسی، دورهای که از آن آمده است را شامل شود. برای نمونههایی از یک حیوان یا گیاه، ممکن است شامل طبقهبندی آن باشد، که مجموعهای از نامهای لاتین است که آن را طبقهبندی میکنند.
همه این اطلاعات با هم، حجم بسیار زیادی از دادهها را تشکیل میدهند.
اما ترکیب دادهها در دامنههای مختلف با استانداردهای مختلف واقعاً دشوار است. خوشبختانه، مدیران مجموعه در تلاش هستند تا فرآیندهای خود را در سراسر رشتهها و برای بسیاری از انواع نمونهها استاندارد کنند. کمکهای مالی به جوامع علمی کمک کرده است تا ابزارهایی برای استانداردسازی بسازند.
در مجموعههای زیستی، ابزار Specify به مدیران این امکان را میدهد تا به سرعت نمونهها را با منوهای کشویی که از قبل با استانداردهایی برای طبقهبندی و سایر پارامترها برای توصیف مداوم نمونههای ورودی پر شدهاند، طبقهبندی کنند.
یک استاندارد فراداده رایج در زیستشناسی Darwin Core است. فرادادهها و ابزارهای مشابه و تثبیتشدهای در سراسر علوم وجود دارد تا گردش کار گرفتن اقلام واقعی و قرار دادن آنها در یک دستگاه را تا حد امکان آسان کند.
ابزارهای ویژه مانند اینها و فرادادهها به مدیران مجموعه کمک میکنند تا دادههای اشیاء خود را برای اهداف تحقیقاتی و آموزشی قابل استفاده مجدد کنند.
همه چیزهای کوچک
تیم من و من 10 گروه متمرکز با مجموع 32 شرکت کننده از چندین جامعه نمونه فیزیکی انجام دادیم. اینها شامل مدیران مجموعه در سراسر رشتهها، از جمله مردمشناسی، باستانشناسی، گیاهشناسی، زمینشناسی، ماهیشناسی، حشرهشناسی، خزندهشناسی و دیرینهشناسی بود.
هر شرکتکننده به سؤالاتی درباره نحوه دسترسی، سازماندهی، ذخیره و استفاده از دادهها از مجموعههای خود در تلاش برای آماده سازی مطالب خود برای استفاده هوش مصنوعی پاسخ داد. در حالی که افراد انسانی باید رضایت خود را برای مطالعه ارائه دهند، اکثر گونهها این کار را نمیکنند. بنابراین، یک هوش مصنوعی میتواند دادهها را از مجموعههای فیزیکی غیرانسانی بدون نگرانی در مورد حریم خصوصی یا رضایت جمعآوری و تجزیه و تحلیل کند.
ما دریافتیم که مدیران مجموعه از زمینهها و مؤسسات مختلف، شیوههای مختلفی در هنگام آماده سازی مجموعههای فیزیکی خود برای هوش مصنوعی دارند. نتایج ما نشان میدهد که استانداردسازی انواع فرادادههایی که مدیران ثبت میکنند و نحوه ذخیره آنها در سراسر مجموعهها میتواند اقلام موجود در این نمونهها را در دسترستر و قابل استفادهتر کند.
پروژههای تحقیقاتی اضافی مانند مطالعه ما میتوانند به مدیران مجموعه کمک کنند تا زیرساختهایی را که برای آمادهسازی دادههای خود برای ماشین نیاز دارند، بسازند. تخصص انسانی میتواند به اطلاع رسانی به ابزارهای هوش مصنوعی کمک کند که اکتشافات جدیدی را بر اساس گنجینههای قدیمی موجود در مجموعههای موزه انجام میدهند.