موزه‌ها داده‌های فراوانی دارند و هوش مصنوعی می‌تواند دسترسی به آن‌ها را آسان‌تر کند - اما استانداردسازی و سازماندهی آن در زمینه‌های مختلف آسان نخواهد بود

نوشته بردلی وید بیشاپ ، دانشگاه تنسی

هسته‌های یخی در فریزرها، دایناسورها در نمایش، ماهی‌ها در شیشه‌ها، پرندگان در جعبه‌ها، بقایای انسانی و آثار باستانی از تمدن‌های دور که تعداد کمی از مردم آن‌ها را می‌بینند - مجموعه‌های موزه مملو از این‌ها و موارد دیگر است.

این مجموعه‌ها گنجینه‌هایی هستند که تاریخ طبیعی و انسانی سیاره را بازگو می‌کنند و به دانشمندان در زمینه‌های مختلف مانند زمین‌شناسی (Geology)، دیرینه‌شناسی (Paleontology)، مردم‌شناسی (Anthropology) و غیره کمک می‌کنند. آنچه در سفر به موزه می‌بینید تنها بخش کوچکی از شگفتی‌های موجود در مجموعه آن‌ها است.

موزه‌ها عموماً می‌خواهند محتویات مجموعه‌های خود را به صورت فیزیکی یا دیجیتالی در اختیار معلمان و محققان قرار دهند. با این حال، کارکنان هر مجموعه روش خاص خود را برای سازماندهی داده‌ها دارند، بنابراین پیمایش این مجموعه‌ها می‌تواند چالش برانگیز باشد.

ایجاد، سازماندهی و توزیع نسخه‌های دیجیتالی نمونه‌های موزه یا اطلاعات مربوط به موارد فیزیکی در یک مجموعه، نیازمند مقادیر باورنکردنی داده است. و این داده‌ها می‌توانند به مدل‌های یادگیری ماشین یا سایر هوش‌های مصنوعی برای پاسخ به سوالات بزرگ وارد شوند.

در حال حاضر، حتی در یک حوزه تحقیقاتی واحد، یافتن داده‌های مناسب نیازمند پیمایش مخازن مختلف است. هوش مصنوعی می‌تواند به سازماندهی مقادیر زیادی از داده‌ها از مجموعه‌های مختلف کمک کند و اطلاعات را برای پاسخ به سوالات خاص بیرون بکشد.

اما استفاده از هوش مصنوعی یک راه حل کامل نیست. مجموعه‌ای از شیوه‌ها و سیستم‌های مشترک برای مدیریت داده‌ها بین موزه‌ها می‌تواند به بهبود کیوریتوری داده و به اشتراک گذاری لازم برای انجام کار هوش مصنوعی کمک کند. این شیوه‌ها می‌توانند به انسان‌ها و ماشین‌ها کمک کنند تا اکتشافات جدیدی از این مجموعه‌های ارزشمند داشته باشند.

به عنوان یک دانشمند اطلاعات که رویکردها و نظرات دانشمندان را در مورد مدیریت داده‌های تحقیق مطالعه می‌کند، دیده‌ام که چگونه زیرساخت جمع‌آوری فیزیکی جهان، یک تکه پارچه از اشیاء و فراداده‌های مرتبط آن‌ها است.

ابزارهای هوش مصنوعی می‌توانند کارهای شگفت‌انگیزی انجام دهند، مانند ساخت مدل‌های سه بعدی از نسخه‌های دیجیتالی شده اقلام موجود در مجموعه‌های موزه، اما تنها در صورتی که داده‌های سازمان یافته کافی در مورد آن مورد موجود باشد. برای اینکه ببینیم هوش مصنوعی چگونه می‌تواند به مجموعه‌های موزه کمک کند، تیم محققان من با برگزاری گروه‌های متمرکز با افرادی که مجموعه‌های موزه را مدیریت می‌کردند، شروع کرد.

مدیران مجموعه

هنگامی که یک مورد وارد مجموعه موزه می‌شود، مدیران مجموعه افرادی هستند که ویژگی‌های آن مورد را توصیف می‌کنند و داده‌هایی در مورد آن تولید می‌کنند. آن داده‌ها که فراداده نامیده می‌شوند، به دیگران اجازه می‌دهند از آن استفاده کنند و ممکن است شامل مواردی مانند نام جمع‌آورنده، موقعیت جغرافیایی، زمان جمع‌آوری و در مورد نمونه‌های زمین‌شناسی، دوره‌ای که از آن آمده است، باشد. برای نمونه‌هایی از یک حیوان یا گیاه، ممکن است شامل طبقه‌بندی (Taxonomy) آن باشد، که مجموعه‌ای از نام‌های لاتین است که آن را طبقه‌بندی می‌کنند.

در مجموع، این اطلاعات به مقدار حیرت‌انگیزی از داده‌ها می‌رسد.

اما ترکیب داده‌ها در دامنه‌های مختلف با استانداردهای مختلف واقعاً دشوار است. خوشبختانه، مدیران مجموعه در تلاشند تا فرآیندهای خود را در سراسر رشته‌ها و برای انواع مختلف نمونه‌ها استاندارد کنند. کمک‌های مالی به جوامع علمی کمک کرده است تا ابزارهایی برای استانداردسازی بسازند.

در مجموعه‌های بیولوژیکی، ابزار Specify به مدیران اجازه می‌دهد تا به سرعت نمونه‌ها را با منوهای کشویی که با استانداردهای طبقه‌بندی و سایر پارامترها از قبل پر شده‌اند، طبقه‌بندی کنند تا نمونه‌های ورودی را به طور مداوم توصیف کنند.

یک استاندارد رایج فراداده در زیست‌شناسی Darwin Core است. فراداده‌ها و ابزارهای مشابه به خوبی تثبیت شده در سراسر علوم وجود دارند تا گردش کار گرفتن اقلام واقعی و قرار دادن آن‌ها در یک ماشین را تا حد امکان آسان کنند.

ابزارهای ویژه مانند این‌ها و فراداده به مدیران مجموعه کمک می‌کنند تا داده‌های اشیاء خود را برای اهداف تحقیق و آموزش قابل استفاده مجدد کنند.

بسیاری از اقلام موجود در مجموعه‌های موزه اطلاعات زیادی در مورد منشاء خود ندارند. ابزارهای هوش مصنوعی می‌توانند به پر کردن شکاف‌ها کمک کنند.

همه چیزهای کوچک

تیم من و من 10 گروه متمرکز را با مجموع 32 شرکت‌کننده از چندین جامعه نمونه فیزیکی انجام دادیم. این‌ها شامل مدیران مجموعه در سراسر رشته‌ها ، از جمله مردم‌شناسی، باستان‌شناسی، گیاه‌شناسی، زمین‌شناسی، ماهی‌شناسی، حشره‌شناسی، خزنده‌شناسی و دیرینه‌شناسی بودند.

هر شرکت‌کننده به سوالاتی در مورد نحوه دسترسی، سازماندهی، ذخیره و استفاده از داده‌ها از مجموعه‌های خود در تلاش برای آماده‌سازی مواد خود برای استفاده هوش مصنوعی پاسخ داد. در حالی که افراد انسانی باید رضایت خود را برای مطالعه ارائه دهند، اکثر گونه‌ها این کار را نمی‌کنند. بنابراین، یک هوش مصنوعی می‌تواند داده‌ها را از مجموعه‌های فیزیکی غیرانسانی بدون نگرانی از حریم خصوصی یا رضایت جمع‌آوری و تجزیه و تحلیل کند.

ما دریافتیم که مدیران مجموعه از زمینه‌ها و مؤسسات مختلف، شیوه‌های بسیار متفاوتی در زمینه آماده‌سازی مجموعه‌های فیزیکی خود برای هوش مصنوعی دارند. نتایج ما نشان می‌دهد که استانداردسازی انواع فراداده‌هایی که مدیران ثبت می‌کنند و روش‌هایی که آن‌ها را در سراسر مجموعه‌ها ذخیره می‌کنند، می‌تواند اقلام موجود در این نمونه‌ها را قابل دسترس‌تر و قابل استفاده‌تر کند.

پروژه‌های تحقیقاتی اضافی مانند مطالعه ما می‌توانند به مدیران مجموعه کمک کنند تا زیرساخت‌هایی را که برای آماده‌سازی داده‌های خود برای ماشین نیاز دارند، بسازند. تخصص انسانی می‌تواند به اطلاع‌رسانی ابزارهای هوش مصنوعی کمک کند که بر اساس گنجینه‌های قدیمی موجود در مجموعه‌های موزه، اکتشافات جدیدی انجام دهند.

بردلی وید بیشاپ ، استاد علوم اطلاعات، دانشگاه تنسی

این مقاله از The Conversation تحت مجوز Creative Commons بازنشر شده است. مقاله اصلی را بخوانید.