ویفرهای در حال پردازش در اتاق تمیز Q.ANT (منبع: Q.ANT)
ویفرهای در حال پردازش در اتاق تمیز Q.ANT (منبع: Q.ANT)

آغاز تولید شتاب‌دهنده‌های هوش مصنوعی فوتونی Q.ANT در اشتوتگارت

شرکت آلمانی Q.ANT، که تراشه‌های شتاب‌دهنده هوش مصنوعی فوتونی از جنس نیوبات لیتیوم تولید می‌کند، یک خط CMOS موجود را به خط تولید آزمایشی برای تراشه‌های محاسباتی فوتونی خود تبدیل کرده و تولید را آغاز کرده است.

مایکل فورتش، مدیرعامل Q.ANT، به EE Times گفت: «کارخانه‌هایی مانند این در سراسر جهان وجود دارند و قدیمی تلقی می‌شوند. اما ما می‌گوییم: شما می‌توانید به طور استراتژیک چند ابزار را جایگزین کنید، که بیشتر برای ثبات فرآیند است تا تولید، و با حداقل سرمایه‌گذاری، می‌توانید آنها را برای ارائه خدمات ریخته‌گری برای تراشه‌های هوش مصنوعی آینده تغییر کاربری دهید.»

Q.ANT مبلغ ۱۴ میلیون یورو (۱۴.۵ میلیون دلار) در ماشین‌آلات و تجهیزات به عنوان بخشی از بازسازی خط تولید آزمایشی ۹۰ نانومتری جدید در موسسه میکروالکترونیک (IMS Chips) در اشتوتگارت آلمان سرمایه‌گذاری کرده است. این خط قادر به تولید تا ۱۰۰۰ ویفر در سال است.

فورتش گفت: «با توجه به نحوه تحول اقتصاد جهانی، مهم‌تر می‌شود که خود را از زنجیره‌های تامین بزرگتر مستقل کنیم. اکنون می‌توانیم تراشه‌ها را به صورت محلی تولید کنیم، زیرا فناوری موجود را ارتقا داده‌ایم، این خط را برای ساخت تراشه‌های با کارایی بالای هوش مصنوعی آینده تغییر کاربری داده‌ایم و این را می‌توان در هر نقطه از جهان کپی کرد.»

فورتش گفت، علی‌رغم وجود Q در نام، Q.ANT یک شرکت محاسبات کوانتومی نیست. این استارت‌آپ آلمانی در سال ۲۰۱۸ تاسیس شد تا تراشه‌های فوتونی مبتنی بر نیوبات لیتیوم لایه نازک (TFLN) را تجاری‌سازی کند - به طور خاص، دستگاه‌هایی مبتنی بر یک لایه عایق نیوبات لیتیوم به ضخامت ۶۰۰ نانومتر. نیوبات لیتیوم به طور گسترده در صنعت مخابرات برای مدولاتورهای نوری و سایر اجزای نوری استفاده می‌شود.

مانند سایر فناوری‌های محاسبات فوتونی، تراشه Q.ANT از تداخل‌سنج ماخ-زندر به عنوان یک مدولاتور استفاده می‌کند. در نسخه Q.ANT، ضریب شکست موجبرها با اعمال ولتاژ کنترل می‌شود، طرحی که توسط Lightelligence نیز استفاده می‌شود. تفاوت کلیدی استفاده از نیوبات لیتیوم به جای فوتونیک سیلیکون است.

فورتش گفت: «وقتی صحبت از الکتریسیته به میان می‌آید، سیلیکون همه‌چیز است، اما نور را جذب می‌کند. انجام مدولاسیون و غیره واقعاً سخت است، بنابراین رقبا هرگز نتوانستند دقت را به اندازه کافی بالا ببرند تا یک معادله معنادار را انجام دهند، ما به راحتی دقت ۱۶ بیتی داریم زیرا می‌توانیم نور را آنقدر دقیق کنترل کنیم که هیچ تاثیری از نویز پس‌زمینه الکترونیکی روی نور نبینیم.»

فورتش گفت، در حالی که عوامل زیادی در دستیابی به دقت ۱۶ بیتی نقش دارند، عامل اصلی خواص حرارتی مواد است.

او گفت: «اساساً، ما هیچ پخش حرارتی روی لایه فوتونیک نداریم، و این بدان معناست که خود لایه به اندازه محیط اطراف سرد یا گرم است. این بدان معناست که هیچ نوسان حرارتی، هیچ تداخل بین عناصر و هیچ چیز وجود ندارد.»

او افزود: «ما اطمینان داریم که در نسل بعدی می‌توانیم آن را به ۳۲ بیت نیز ارتقا دهیم.»

به عنوان یک فناوری فوتونی، TFLN Q.ANT می‌تواند مزایای مشابهی را برای محاسبات مبتنی بر فوتونیک سیلیکون ارائه دهد - راندمان انرژی خوب، مقیاس‌پذیری از طریق مالتی‌پلکسینگ طول موج، فرکانس‌های عملیاتی سریع - اما Q.ANT قصد دارد این فناوری را یک قدم فراتر ببرد.

فورتش گفت: «مشکل این است که CMOS برای توابع غیرخطی چندان خوب نیست - اساساً روی یک ترانزیستور بالا و پایین است. پردازنده دیجیتال برای تقریب‌های خطی بسیار خوب است، اما برای تقریب یک مسئله غیرخطی بسیار پیش‌پاافتاده به میلیون‌ها پارامتر نیاز دارید.»

مثال فورتش یک دایره است - که برای تقریب با توابع خطی به پارامترهای زیادی نیاز دارد، اما یک تابع موج سینوسی فقط به دو پارامتر نیاز دارد.

او گفت: «با استفاده از یک کامپیوتر آنالوگ، ما دسترسی بومی به معادلات خطی و غیرخطی داریم. بنابراین می‌توانیم مدل‌های قدیمی را بنویسیم، اما همچنین مدل‌های جدید خود را با توابع غیرخطی… این زیبایی این فناوری است. محاسبات آنالوگ به طور طبیعی در معماری پردازنده به توابع غیرخطی پیچیده دسترسی می‌دهد و با این کار می‌توانید در مصرف انرژی صرفه‌جویی زیادی کنید.»

این قابلیت غیرخطی اساس شتاب‌دهی شبکه‌های کولموگروف-آرنولد است که وزن‌های خطی را با توابع غیرخطی جایگزین می‌کنند تا تعداد پارامترها را کاهش دهند. فورتش گفت، محاسبات مورد نیاز برای آموزش و استنتاج این مدل‌ها با استفاده از فوتونیک به شدت کاهش می‌یابد، زیرا تعداد پارامترها بسیار کمتر از یادگیری عمیق اصلی است.

او گفت: «از نظر سخت‌افزاری، این توابع غیرخطی [امروزه] بسیار پرهزینه هستند - اگر بخواهم یک تابع سینوسی یا یک تبدیل فوریه را اجرا کنم، به میلیون‌ها ترانزیستور نیاز دارم. در پایان، استفاده از معادلات خطی با استفاده از معماری CMOS اقتصادی‌تر است و به همین دلیل است که [همه] هنوز این کار را انجام می‌دهند.»

کد مدل باید تغییر کند تا از این قابلیت غیرخطی استفاده کند، که مدل‌ها را خاص Q.ANT می‌کند، اما به گفته فورتش، صرفه‌جویی بالقوه در انرژی «فوق‌العاده» است.

پردازنده فوتونی Q.ANT روی یک کارت PCIe با پردازنده میزبان x86 CPU عرضه می‌شود. نسخه فعلی دارای یک FPGA است که تراشه فوتونی را کنترل می‌کند. فورتش گفت، سیستم‌های فعلی دارای یک کارت PCIe در هر سرور 1U هستند، اما نسل‌های آینده متراکم‌تر خواهند بود و حداقل 16 کارت PCIe در 3U بدون نیاز به خنک‌کننده اضافی خواهند داشت. چهار کارت امروزی می‌توانند یک مدل پارامتری 1B را استنتاج کنند. Q.ANT ادعا می‌کند که تراشه‌های آن 30 برابر کارآمدتر از GPUها هستند و 50 برابر افزایش سرعت استنتاج دارند (بر اساس تشخیص دست‌نوشته MNIST با دقت پیش‌بینی 95%). یک نسخه نمایشی از طریق ابر در دسترس است.

نمایی نزدیک از تراشه فوتونی Q.ANT
نمایی نزدیک از تراشه فوتونی Q.ANT (منبع: Q.ANT)