بدن انسان به طور مداوم سیگنالهای مختلفی تولید میکند که میتوان آنها را از خارج بدن با دستگاههای پوشیدنی اندازهگیری کرد. این سیگنالهای زیستی - از ضربان قلب گرفته تا وضعیت خواب و سطح اکسیژن خون - میتوانند نشان دهند که آیا فرد تغییرات خلقی دارد یا میتوانند برای تشخیص انواع اختلالات جسمی یا مغزی استفاده شوند.
جمعآوری مقدار زیادی داده سیگنال زیستی میتواند نسبتاً ارزان باشد. محققان میتوانند مطالعهای را سازماندهی کنند و از شرکتکنندگان بخواهند که برای چند روز از یک دستگاه پوشیدنی شبیه به ساعت هوشمند استفاده کنند. با این حال، برای آموزش یک الگوریتم یادگیری ماشین برای یافتن رابطه بین یک سیگنال زیستی خاص و یک اختلال سلامتی، ابتدا باید به الگوریتم آموزش دهید که آن اختلال را تشخیص دهد. اینجاست که مهندسان کامپیوتر مانند من وارد عمل میشوند.
بسیاری از ساعتهای هوشمند تجاری، مانند ساعتهای اپل، آلیوکور، گوگل و سامسونگ، در حال حاضر از تشخیص فیبریلاسیون دهلیزی (atrial fibrillation) پشتیبانی میکنند. فیبریلاسیون دهلیزی یک نوع شایع از ریتم نامنظم قلب است و عدم درمان آن میتواند منجر به سکته مغزی شود. یک راه برای تشخیص خودکار فیبریلاسیون دهلیزی، آموزش یک الگوریتم یادگیری ماشین برای تشخیص ظاهر فیبریلاسیون دهلیزی در دادهها است.
این رویکرد یادگیری ماشین نیاز به مجموعهدادههای بزرگ سیگنال زیستی دارد که در آن موارد فیبریلاسیون دهلیزی برچسبگذاری شده باشند. الگوریتم میتواند از موارد برچسبگذاریشده برای یادگیری تشخیص رابطه بین سیگنال زیستی و فیبریلاسیون دهلیزی استفاده کند.
فرایند برچسبگذاری میتواند بسیار پرهزینه باشد، زیرا نیاز به متخصصانی مانند متخصصان قلب و عروق دارد تا میلیونها نقطه داده را بررسی کرده و هر مورد فیبریلاسیون دهلیزی را برچسبگذاری کنند. همین مشکل به بسیاری از سیگنالهای زیستی و اختلالات دیگر نیز گسترش مییابد.
برای حل این مشکل، محققان روشهای جدیدی را برای آموزش الگوریتمهای یادگیری ماشین با برچسبهای کمتر توسعه دادهاند. با آموزش اولیه یک مدل یادگیری ماشین برای پر کردن جاهای خالی دادههای سیگنال زیستی بدون برچسب در مقیاس بزرگ، مدل یادگیری ماشین برای یادگیری رابطه بین یک سیگنال زیستی و یک اختلال با برچسبهای کمتر آماده میشود. این به اصطلاح پیشآموزش (pretraining) نامیده میشود. پیشآموزش حتی به یک مدل یادگیری ماشین کمک میکند تا رابطه بین یک سیگنال زیستی و یک اختلال را بیاموزد، حتی اگر روی یک سیگنال زیستی کاملاً نامرتبط پیشآموزش داده شده باشد.
چالشهای کار با سیگنالهای زیستی
یافتن روابط بین سیگنالهای زیستی و اختلالات میتواند دشوار باشد، زیرا نویز (noise) یا دادههای نامربوط، تفاوت بین سیگنالهای زیستی افراد و همچنین ممکن است رابطه بین یک سیگنال زیستی و اختلال واضح نباشد.
اولاً، سیگنالهای زیستی حاوی مقدار زیادی نویز هستند. به عنوان مثال، هنگامی که در حین دویدن یک ساعت هوشمند میپوشید، ساعت حرکت میکند. این باعث میشود که حسگر سیگنال زیستی در مکانهای مختلف در طول دویدن ضبط کند. از آنجایی که مکانها در طول دویدن متفاوت هستند، تغییرات در مقدار سیگنال زیستی ممکن است اکنون به دلیل تغییرات در محل ضبط باشد تا به دلیل فرایندهای فیزیولوژیکی.
دوم، سیگنالهای زیستی هر فرد منحصر به فرد است. به عنوان مثال، محل قرارگیری رگها اغلب بین افراد متفاوت است. این بدان معناست که حتی اگر ساعتهای هوشمند دقیقاً در یک محل روی مچ دست همه افراد پوشیده شوند، سیگنال زیستی مربوط به آن رگها به طور متفاوتی از یک فرد به فرد دیگر ثبت میشود. همان سیگنال اساسی، مانند ضربان قلب فرد، منجر به مقادیر مختلف سیگنال زیستی میشود.
خود سیگنال اساسی نیز میتواند برای افراد یا گروههایی از افراد منحصر به فرد باشد. ضربان قلب استراحت یک فرد متوسط حدود 60-80 ضربه در دقیقه است، اما ورزشکاران میتوانند ضربان قلب استراحت به اندازه 30-40 ضربه در دقیقه داشته باشند.
در نهایت، رابطه بین یک سیگنال زیستی و یک اختلال اغلب پیچیده است. این بدان معناست که اختلال بلافاصله از نگاه کردن به سیگنال زیستی مشخص نیست.
الگوریتمهای یادگیری ماشین به محققان اجازه میدهند تا از دادهها بیاموزند و پیچیدگی، نویز و تغییرپذیری افراد را در نظر بگیرند. با استفاده از مجموعهدادههای بزرگ سیگنال زیستی، الگوریتمهای یادگیری ماشین قادر به یافتن روابط واضحی هستند که برای همه اعمال میشود.
یادگیری پر کردن جاهای خالی
محققان میتوانند از دادههای سیگنال زیستی بدون برچسب به عنوان یک گرم کردن (warmup) برای الگوریتم یادگیری ماشین استفاده کنند. این گرم کردن، یا پیشآموزش، الگوریتم یادگیری ماشین را برای یافتن رابطه بین سیگنال زیستی و یک اختلال آماده میکند. این کمی شبیه قدم زدن در پارک برای به دست آوردن نقشه زمین قبل از تمرین یک مسیر برای دویدن است.
راههای زیادی برای پیشآموزش یک الگوریتم یادگیری ماشین وجود دارد. در تحقیقات من با لی لو، محقق آزمایشگاه دالبی، و تحقیقات قبلی، به الگوریتم یادگیری ماشین آموزش داده میشود تا جاهای خالی را پر کند.
برای انجام این کار، ما یک سیگنال زیستی را میگیریم و به طور مصنوعی شکافهایی با طول معین - به عنوان مثال، یک ثانیه - ایجاد میکنیم. سپس به الگوریتم یادگیری ماشین آموزش میدهیم تا قسمت گمشده سیگنال زیستی را پر کند. این امکانپذیر است زیرا الگوریتم یادگیری ماشین میبیند که سیگنال زیستی قبل و بعد از شکاف چگونه است.
اگر ضربان قلب یک فرد قبل از شکاف حدود 60 ضربه در دقیقه باشد، به احتمال زیاد یک ضربان قلب در شکاف یک ثانیهای وجود خواهد داشت. در این مورد، ما در حال آموزش الگوریتم یادگیری ماشین برای پیشبینی زمان وقوع آن ضربان قلب هستیم.
هنگامی که الگوریتم یادگیری ماشین را برای انجام این کار آموزش دادیم، رابطهای بین ضربان قلب فرد و زمان وقوع ضربه بعدی پیدا کرده است. اکنون میتوانیم الگوریتم یادگیری ماشین را با این رابطه بین ضربان قلب طبیعی و سیگنال زیستی که قبلاً آموخته شده است، آموزش دهیم. این کار یادگیری رابطه بین ضربان قلب و فیبریلاسیون دهلیزی را برای الگوریتم آسانتر میکند. از آنجایی که فیبریلاسیون دهلیزی با ضربان قلب سریع و نامنظم مشخص میشود و الگوریتم اکنون در پیشبینی زمان وقوع ضربان قلب خوب است، میتواند به سرعت این بینظمیها را تشخیص دهد.
ایده پر کردن جاهای خالی را میتوان به سایر سیگنالهای زیستی نیز تعمیم داد. تحقیقات قبلی نشان دادهاند و کار ما مجدداً تأیید کرد که پیشآموزش یک مدل روی یک سیگنال زیستی بدون هیچ برچسبی به آن اجازه میدهد تا روابط بالینی مفیدی را از سایر سیگنالهای زیستی با برچسبهای کم بیاموزد. این میانبر به این معنی است که محققان میتوانند روی سیگنالهای زیستی که جمعآوری آنها آسان است پیشآموزش کنند و از مدل یادگیری ماشین روی سیگنالهایی استفاده کنند که جمعآوری و برچسبگذاری آنها دشوار است.
توسعه سریعتر تشخیص اختلال
با بهبود پیشآموزش، محققان میتوانند الگوریتمهای یادگیری ماشین را در تشخیص بیماریها و اختلالات بهتر و کارآمدتر کنند. بهبودهای پیشآموزش باعث کاهش هزینه و زمان صرف شده توسط متخصصان برای برچسبگذاری میشود.
نمونه اخیر از الگوریتمهای یادگیری ماشین که برای تشخیص زودهنگام استفاده میشود، ویژگی Loss of Pulse ساعت هوشمند گوگل است. زمینه در حال ظهور پیشآموزش سیگنال زیستی میتواند به توسعه سریعتر ویژگیهای مشابه با استفاده از طیف گستردهتری از سیگنالهای زیستی و برای طیف وسیعتری از اختلالات کمک کند.
با افزایش انواع سیگنالهای زیستی و دادههای بیشتر، محققان ممکن است بتوانند روابطی را کشف کنند که به طور چشمگیری تشخیص زودهنگام بیماری و اختلالات را بهبود میبخشد. هرچه بسیاری از بیماریها و اختلالات زودتر یافت شوند، برنامه درمانی برای بیماران بهتر عمل میکند.