تصویری از خط زایا
تصویری از خط زایا

کاهش زمان تجزیه و تحلیل ژنومیکس و تک سلولی با NVIDIA Parabricks و NVIDIA AI Blueprints به چند دقیقه

NVIDIA Parabricks یک مجموعه نرم افزاری مقیاس پذیر برای تجزیه و تحلیل ژنومیکس است که چالش های omics را با محاسبات شتاب یافته و یادگیری عمیق حل می کند تا قفل پیشرفت های علمی جدید را باز کند.

NVIDIA Parabricks v4.5 که در NVIDIA GTC 2025 منتشر شد، با پشتیبانی از جدیدترین معماری های NVIDIA GPU و بهبود تراز و فراخوانی متغیر با ترکیب Giraffe و DeepVariant، از مقدار فزاینده داده ها پشتیبانی می کند. این نسخه همچنین شامل بهبود عملکرد و کاهش زمان تجزیه و تحلیل در چندین ابزار پیشرو در صنعت از جمله STAR، FQ2BAM و Minimap2 است.

Parabricks v4.5 با NVIDIA AI Blueprints جدید برای تجزیه و تحلیل ژنومیکس و تک سلولی همراه است که به متخصصان بیوانفورماتیک و ارائه دهندگان پلت فرم ژنومیکس این امکان را می دهد که به راحتی NVIDIA Parabricks و NVIDIA RAPIDS را بدون نیاز به GPU های محلی یا تدارکات ابری خود مدیریت مستقر و آزمایش کنند. با گسترش دسترسی، دانشمندان و محققان می توانند سریعتر شروع به کار کنند تا درک ژنومی را بیشتر کنند.

نکات برجسته انتشار عبارتند از:

چه خبر

  • NVIDIA Blueprints از طریق NVIDIA Brev در دسترس است، از جمله تجزیه و تحلیل ژنومیکس با استفاده از Parabricks و تجزیه و تحلیل تک سلولی با استفاده از RAPIDS و RAPIDS-singlecell.
  • پشتیبانی Parabricks از NVIDIA Blackwell، از جمله GPU جدید NVIDIA RTX PRO 6000 Blackwell Server Edition، که با استفاده از چهار GPU، تجزیه و تحلیل کلی germline را به 7 دقیقه و 56 ثانیه کاهش می دهد.
  • قابلیت ترکیب آسان Giraffe و DeepVariant، ترکیب قدرت تجزیه و تحلیل پان ژنوم با استاندارد طلایی برای فراخوانی متغیر.
  • همکاری با Roche Sequencing.

ویژگی های بهبود یافته

  • شتاب STAR (شتاب 2 برابر نسبت به سرعت موجود)
  • FQ2BAM سریعتر (بهبود حالت بازیابی)
  • حالت فراخوانی اجباری سریعتر در Haplotypecaller/Mutectcaller
  • Giraffe سریعتر (بیش از 2 برابر شتاب نسبت به VG Giraffe پایه)
  • شتاب Minimap2 (از جمله splice-alignment)

به راحتی با NVIDIA Blueprints، تجزیه و تحلیل ژنومیکس و تک سلولی را مستقر و اجرا کنید

AI Blueprints گردش کارهای مرجع را برای هوش مصنوعی عامل و مولد ارائه می دهد، بنابراین شرکت ها می توانند برنامه های کاربردی هوش مصنوعی سفارشی را بسازند، آزمایش کنند و مستقر کنند. قبل از استقرار یک طرح بزرگ سازمانی، متخصصان بیوانفورماتیک اکنون از طریق NVIDIA Brev به طرح های سبک وزن دسترسی دارند که ارزیابی کتابخانه های ژنومیکس شتاب یافته را که توسط فناوری های NVIDIA فعال شده اند، بدون راه اندازی زیرساخت یا استقرارهای دشوار آسان می کند.

در NVIDIA GTC 2025، NVIDIA دو طرح برای موارد استفاده از ژنومیکس راه اندازی کرد: تجزیه و تحلیل ژنومیکس و تجزیه و تحلیل تک سلولی. هر دو به متخصصان بیوانفورماتیک و ارائه دهندگان پلت فرم ژنومیکس این امکان را می دهند که به راحتی فناوری NVIDIA - از جمله NVIDIA Parabricks و RAPIDS - را مستقر کرده و به آن دسترسی پیدا کنند.

برای تجزیه و تحلیل ژنومیکس، متخصصان بیوانفورماتیک می توانند یک گردش کار تجزیه و تحلیل توالی یابی کل اگزوم را در عرض چند دقیقه در هر ابری که از طریق NVIDIA Brev در دسترس است، با استفاده از NVIDIA Parabricks FQ2BAM برای تراز و DeepVariant برای فراخوانی متغیر امتحان کنند.

برای تجزیه و تحلیل تک سلولی، دانشمندان همچنین می توانند با امتحان کردن rapids-singlecell، که توسط scverse توسعه یافته است، تجزیه و تحلیل داده ها را تقریباً در زمان واقعی آزمایش کنند. این امر UMAP 676 برابر سریعتر و PCA 70 برابر سریعتر را در یک مجموعه داده 1M سلولی امکان پذیر می کند.

پروفسور دکتر فابیان جی. تیس، دارنده مدرک دکترا، از دانشکده محاسبات، اطلاعات و فناوری و دانشکده علوم زیستی TUM، TU مونیخ می گوید: "فعال کردن دسترسی یکپارچه به نوت بوک های RAPIDS-singlecell در سراسر پلت فرم های ابری، ابزاری قدرتمند و کارپسند را در اختیار محققان قرار می دهد." "با در دسترس قرار دادن منابع محاسباتی پیشرفته تر، ما پذیرش بیشتر ابزارهای scverse را تقویت می کنیم و به جامعه قدرت می دهیم تا تجزیه و تحلیل و نوآوری را در تجزیه و تحلیل تک سلولی تسریع بخشد."

بهبود عملکرد با Parabricks در NVIDIA Blackwell

NVIDIA Blackwell با پیشرفت در هوش مصنوعی مولد و محاسبات شتاب یافته، جدیدترین معماری GPU است که به طور چشمگیری عملکرد و کارایی را در مقیاس بزرگ بهبود می بخشد.

با جدیدترین نسخه v4.5، Parabricks اکنون برای استفاده با Blackwell در دسترس است، که امکان شتاب بیشتر و کاهش زمان اجرا را با استفاده از واحدهای ALU و هسته های تانسور افزایش یافته برای عملکرد بهتر فراهم می کند. در یک RTX PRO 6000 واحد، گردش کار fastq2bam و Deepvariant 1.75 برابر سریعتر از NVIDIA H100 PCIe بودند.

مقایسه عملکرد GPU H100 PCIe با جدیدترین NVIDIA RTX PRO 6000 برای مقیاس پذیری germline parabricks (بر حسب ثانیه).
شکل 1. مقیاس پذیری عملکرد germline Parabricks (بر حسب ثانیه) برای Fastq2bam و DeepVariant در GPU NVIDIA H100 PCIe در مقایسه با جدیدترین NVIDIA RTX PRO 6000

آبهیمانیو (آبهی) ورما، مدیر ارشد فناوری SOPHiA GENETICS می گوید: "NVIDIA Parabricks در حال حاضر سرعت قابل توجهی را در معماری GPU مبتنی بر ابر فعلی ما ارائه می دهد." "با جدیدترین پشتیبانی خود در Blackwell، ما هیجان زده هستیم که شتاب بیشتری و عملکرد پیشرفته تری را در پلت فرم SOPHiA DDM ارائه دهیم. این پیشرفت ما را قادر می سازد تا همچنان زمان پاسخگویی سریع را برای تجزیه و تحلیل های مبتنی بر هوش مصنوعی ارائه دهیم و آزمایشگاه ها، محققان و شرکت های داروسازی زیستی را در سراسر جهان توانمند سازیم. این زمان بندی ایده آل است، زیرا ما شاهد افزایش نمایی در حجم داده ها هستیم که ناشی از توالی یابی عمیق تر و رویکردهای چندوجهی پیشرفته تر در همه زمینه ها است."

بهبود زمان اجرا و افزایش دقت با ترکیب Giraffe و DeepVariant

تراز و فراخوانی متغیر مراحل مهمی در تجزیه و تحلیل داده های ژنومی هستند که با هم کار می کنند تا به درک تغییرات ژنتیکی کمک کنند. اولین قدم با مرتب کردن و مقایسه توالی ها در تراز رخ می دهد. در مرحله بعد، دانشمندان انواع ژنوم های کامل، اگزوم ها و پانل های ژنی را در فراخوانی متغیر شناسایی می کنند.

اگرچه تراز و فراخوانی متغیر اجزای حیاتی توالی یابی با توان عملیاتی بالا هستند، اما فرآیندهای زمان بری هستند که به منابع محاسباتی قابل توجهی نیاز دارند - به ویژه وقتی صحبت از توالی یابی کل ژنوم به میان می آید.

برای کمک به رفع این گلوگاه ها، الگوریتم ها و ابزارهای تخصصی در سراسر مراحل تراز و فراخوانی متغیر توسعه یافته اند - از جمله Giraffe برای تراز و DeepVariant برای فراخوانی متغیر. Giraffe یک ابزار نرم افزاری است که توسط دانشگاه کالیفرنیا، سانتا کروز برای تراز گراف پان ژنوم توسعه یافته است. DeepVariant، یک فراخوان متغیر مبتنی بر یادگیری عمیق است که توسط گوگل توسعه یافته است. اینها نه تنها هر دو ابزار محبوب منبع باز هستند، بلکه به تسریع فرآیندهای مربوطه خود در عین اطمینان از دقت بالاتر کمک می کنند.

Giraffe و DeepVariant هر دو از قبل در Parabricks پشتیبانی می شوند، اما آخرین نسخه v4.5 با بهبود عملکرد در سراسر ابزارها به صورت جداگانه و با هم، شتاب بیشتری را ارائه می دهد.

در نتیجه، دانشمندان و محققان می توانند مراحل حیاتی را حتی سریعتر و در عین حفظ دقت انجام دهند. به عنوان مثال، در NVIDIA L40S زمان اجرا بیش از 6 برابر سریعتر از CPU است. زمان اجرای کل برای Giraffe، پس پردازش و DeepVariant در CPU 11.98 ساعت بود. در NVIDIA L40S، Parabricks v4.5 شاهد کاهش زمان اجرای کل به تنها 1.8 ساعت بود.

اجرای عملکرد L4 و L40S GPU در مقابل CPU Giraffe و DeepVariant در AWS
شکل 2. عملکرد Giraffe و DeepVariant در CPU در مقابل GPU (L4 و L40S). معیارها در AWS اجرا شدند

همکاری جدید با Roche Sequencing

تولید داده های ژنومی در یک نقطه عطف قرار دارد، جایی که فناوری های جدید، مانند توالی یابی بر اساس گسترش (SBX)، اخیراً توسط Roche رونمایی شد، توالی یابی را با نرخ های بی سابقه ای امکان پذیر می کند و نیاز به تجزیه و تحلیل سریعتر و با توان عملیاتی بالاتر دارد.

Roche همراه با الگوریتم های شتاب یافته اختصاصی خود، اجزای سخت افزاری و نرم افزاری NVIDIA را مستقیماً در پلت فرم SBX ادغام کرده است - از جمله اجزای منتخب Parabricks و سایر کتابخانه های شتاب یافته. کار Roche بر روی الگوریتم های شتاب یافته، در همکاری با NVIDIA، یک معماری پیشرفته تجزیه و تحلیل داده ها را فراهم می کند که نقش کلیدی در تحقق پتانسیل کامل نرخ تولید داده های فوق سریع و زمان های اجرای توالی یابی سریع فعال شده توسط SBX دارد.

جان مانیون، معاون علوم محاسباتی در Roche می گوید: "فناوری SBX از طریق نرخ های بالای تولید داده های توالی یابی و زمان های اجرای انعطاف پذیر، که توسط تجزیه و تحلیل یکپارچه و بلادرنگ تقویت می شود، مزایای قابل توجهی را ارائه می دهد." "همکاری استراتژیک با NVIDIA یک جزء مهم از توسعه خط لوله شتاب یافته Roche است که تجزیه و تحلیل محلی کارآمد مراحل پردازش داده های سنگین محاسباتی را با الگوریتم های بهینه شده SBX امکان پذیر می کند و گردش کار تجزیه و تحلیل کاربران را بهبود می بخشد."

آخرین معیارهای Parabricks

علاوه بر ویژگی‌ها و ارتقاء‌های جدید برای هر نسخه، NVIDIA به‌طور مداوم برای بهبود عملکرد معیار در سراسر ابزارها، ابزارها و GPUها تلاش می‌کند. جدول 1 آخرین معیارها را در محبوب ترین GPU های NVIDIA، از جمله جدیدترین پشتیبانی Blackwell در NVIDIA RTX PRO 6000، تشریح می کند.

لطفاً توجه داشته باشید که این معیارها از NVIDIA هستند. سرعت ها بسته به مجموعه داده، نمونه GPU و در دسترس بودن حافظه می توانند متفاوت باشند. زمان‌های اجرا برای الگوریتم‌های فردی هستند. هنگامی که چندین الگوریتم با هم اجرا می شوند، خطوط لوله می توانند تا حدی همپوشانی داشته باشند و زمان های اجرای کلی ممکن است کاهش یابد.

NVIDIA RTX PRO 6000
جدیدترین پشتیبانی
NVIDIA H100 SXM GPU NVIDIA L4 GPU
کمترین هزینه به ازای هر نمونه
2 GPUs 4 GPUs 2 GPUs 4 GPUs 2 GPUs 4 GPUs
Giraffe(جفت شده) 59.37 31.05 60.10 37.68 81.43 44.57
DeepSomatic 43.28 23.93 54.32 35.13 215.33 110.05
Fq2bam(BWA-MEM) 9.02 6.52 10.10 7.28 35.10 19.28
rna_fq2bam(STAR) 7.55 7.03 7.78 10.23 22.28 12.73
fq2bam_meth(BWA-Meth) 32.27 22.13 34.6 20.35 132.43 67.03
DeepVariant 4.67 2.75 7.60 5.90 13.83 8.03
HaplotypeCaller 8.33 3.83 8.63 4.17 14.2 7.03
Mutect2 29.50 13.52 27.67 13.67 50.91 26.63
جدول 1. آخرین معیارها در محبوب‌ترین GPUهای NVIDIA برای جدیدترین پشتیبانی، سریع‌ترین سرعت و کمترین هزینه به ازای هر نمونه. زمان عملکرد بر حسب دقیقه فهرست شده است

30x ژنوم کامل برای Giraffe، fq2bam (BWA-MEM)، DeepVariant و Haplotype Caller با داده های Illumina توالی یابی شد.
50x تومور-طبیعی ژنوم کامل برای DeepSomatic و Mutect2 با داده های Illumina توالی یابی شد.
برای محک زدن fq2bam_meth (BWA-Meth)، ما داده‌های توالی یابی بیسولفیت کل ژنوم را از پورتال ENCODE (Sloan et al. 2016) (https://www.encodeproject.org/) با شناسه‌های زیر دانلود کردیم: ENCSR890UQO (کتابخانه ENCLB898WPW).
برای rna_fq2bam (STAR) ما از یک FASTQ با 381,871,632 خوانش و طول خوانش 98nt (SRA: SRR19653800) استفاده کردیم.

شروع کنید

NVIDIA Parabricks v4.5 عملکرد بهبود یافته و زمان تجزیه و تحلیل کاهش یافته را در بین ابزارهای پیشرو در صنعت ارائه می دهد و پشتیبانی از آخرین معماری NVIDIA Blackwell را ارائه می دهد. Parabricks v4.5 همچنین با طرح‌های هوش مصنوعی برای ژنومیکس و تجزیه و تحلیل تک سلولی همراه است که به کاربران امکان می‌دهد NVIDIA Parabricks و NVIDIA RAPIDS را به راحتی مستقر و آزمایش کنند.

برای شروع با تجزیه و تحلیل ژنومیکس شتاب‌یافته با GPU، NVIDIA Parabricks را دانلود کنید و به گفتگو در انجمن توسعه دهندگان NVIDIA Parabricks بپیوندید.

تقدیر و تشکر

مشارکت ها و تشکر از تیم های Parabricks و RAPIDS. به ویژه برای این نسخه، ما می خواهیم از یک تیم بین وظیفه ای برای اطمینان از این راه اندازی های جدید قدردانی و تشکر کنیم:

برای معیارهای NVIDIA RTX PRO 6000 Blackwell Server Edition و Parabricks: Tong Zhu، Alejandro Chacon، Fabian Berressem، Daniel Puleri و Yang Wang.

برای طرح های هوش مصنوعی با Brev.dev: Severin Dicks، Taurean Dyer، Gary Burnett، Alice Hsiung و Andrew Walters.