اعتبار: تصویر تولید شده توسط VentureBeat با استفاده از Stable Diffusion 3.5 Large
اعتبار: تصویر تولید شده توسط VentureBeat با استفاده از Stable Diffusion 3.5 Large

نگاهی به تحول هوش مصنوعی زوم: از ابزارهای پایه جلسات تا پلتفرم بهره‌وری مبتنی بر LLM و SLM

زوم در طول همه‌گیری کرونا به یک نام آشنا تبدیل شد، زیرا دورکاری تقریباً یک شبه به هنجار تبدیل شد.

در حالی که این شرکت زمانی مترادف با کنفرانس ویدیویی بود، در طول چند سال گذشته به آرامی در حال ساخت یک زیرساخت پیچیده هوش مصنوعی با هدف تعریف مجدد بهره‌وری در محیط کار بوده است. در حالی که کنفرانس ویدیویی مهم است و همچنان سنگ بنای تجارت زوم است، به لطف هوش مصنوعی، اکنون چیزهای بیشتری نیز وجود دارد.

حرکت از جلسه به نقطه عطف

همه می‌دانند که زوم یک فناوری برای جلسات است. اما هدف از جلسه چیست؟

در یک زمینه تجاری، مطمئناً ممکن است جلساتی وجود داشته باشند که هیچ هدفی نداشته باشند، اما اینها باید موارد خارج از قاعده باشند. جلسات باید به چیزی منجر شوند، خواه یک اقدام عملی باشد یا یک نقطه عطف دیگر.

ژوئدونگ (X.D.) هوانگ، مدیر ارشد فناوری زوم، در مصاحبه اختصاصی با VentureBeat گفت: «در عصر هوش مصنوعی فعال، سرانجام فناوری به نقطه‌ای می‌رسد که می‌توانیم از جلسه به نقطه عطف تبدیل شویم.»

امروز، زوم از یک استراتژی تهاجمی هوش مصنوعی فعال رونمایی می‌کند که شامل مجموعه‌ای از خدمات جدید است. این به‌روزرسانی قابلیت‌های فعال را معرفی می‌کند که نویدبخش تبدیل جلسات از رویدادهای ارتباطی به گردش‌های کاری مبتنی بر اقدام است، در کنار یک استودیوی هوش مصنوعی جدید که به شرکت‌ها اجازه می‌دهد عوامل هوش مصنوعی سفارشی ایجاد کنند.

تحول فنی پنهان در پشت هوش مصنوعی فعال زوم

هوانگ قبل از پیوستن به زوم، 30 سال در مایکروسافت کار کرد و روی فناوری‌های گفتاری و همچنین سرویس Azure OpenAI مایکروسافت کار می‌کرد. او هنگام پیوستن به زوم در سال 2023، درس‌های زیادی از آن تجربه آموخت.

تحت هدایت هوانگ، زوم به آرامی شروع به ساخت یک معماری هوش مصنوعی کرد که برای تسهیل وظایف به جای خلاصه کردن مکالمات طراحی شده بود. زوم به طور عمومی مشارکت با Anthropic را در می 2023 اعلام کرد - اما این تنها مدل زبانی بزرگی (LLM) نیست که در زوم استفاده می‌شود.

در حالی که مایکروسافت تیمز عموماً از طریق سرویس Microsoft OpenAI Azure به OpenAI متکی است و گوگل میت توسط Google Gemini پشتیبانی می‌شود، زوم یک رویکرد آگنوستیک نسبت به LLM ها اتخاذ کرده است.

هوانگ توضیح داد که وقتی زوم اولین نسخه از دستیار هوش مصنوعی خود را در سال 2023 راه اندازی کرد، بر اساس هیچ LLM واحدی نبود. در عوض، این شرکت با یک رویکرد فدرال شروع به کار کرد و از چندین LLM از جمله مدل زبانی کوچک (SLM) سفارشی خود استفاده کرد.

هوانگ گفت: "ما با بهترین مدل‌های موجود در بازار، از جمله OpenAI و Anthropic، شریک شده‌ایم، اما مدل زبانی 2 میلیارد پارامتری بسیار سفارشی خود را نیز ساخته‌ایم."

دستیار هوش مصنوعی زوم از یک رویکرد فدرال استفاده می‌کند که در آن مدل کوچک‌تر زوم در ارتباط با مدل‌های زبانی بزرگ‌تر و پیشرو در صنعت استفاده می‌شود. مدل کوچک‌تر در ابتدا ورودی را ارزیابی و پردازش می‌کند و نتایج جزئی سپس به مدل‌های بزرگ‌تر منتقل می‌شوند تا خروجی نهایی را تولید کنند. این رویکرد به زوم اجازه می‌دهد تا از نقاط قوت مدل کوچک‌تر و سفارشی‌شده و مدل‌های بزرگ‌تر و قدرتمندتر استفاده کند، در حالی که هزینه‌ها را کاهش می‌دهد و عملکرد را بهبود می‌بخشد.

چگونه مدل زبانی کوچک در مرکز سفر هوش مصنوعی فعال زوم قرار دارد

شاید از نظر فنی جالب‌ترین جنبه استراتژی هوش مصنوعی زوم، تمرکز آن بر SLM ها باشد. زوم به جای پیروی از روند صنعتی تقطیر مدل‌های کوچک‌تر از مدل‌های بزرگ‌تر، مدل 2 میلیارد پارامتری خود را کاملاً از ابتدا ساخت.

مزیت فنی این رویکرد هنگام سفارشی‌سازی برای حوزه‌های خاص آشکار می‌شود. هوانگ توضیح داد: «هنگامی که سفارشی می‌کنید، تلاش بیشتری می‌طلبد، فقط هدایت یک کشتی بزرگ‌تر دشوار است.»

همانطور که معلوم شد، توانایی سفارشی‌سازی مدل کوچک یک جزء حیاتی برای توسعه گردش‌های کاری خاص هوش مصنوعی فعال است. زوم در آینده پیش‌بینی می‌کند که SLM هایش در نهایت مستقیماً روی دستگاه‌های کاربر اجرا شوند و هم حریم خصوصی بهتری و هم تجربه‌های شخصی‌سازی‌شده‌تری را امکان‌پذیر کنند.

دستیار هوش مصنوعی 2.0: هوش مصنوعی فعال جلسات را به نقاط عطف تبدیل می‌کند

در قلب به‌روزرسانی‌های زوم، دستیار هوش مصنوعی 2.0 قرار دارد که قابلیت‌های هوش مصنوعی زوم را از پشتیبانی جلسات به عملکردهای کاملاً فعال تبدیل می‌کند. با نسخه 2.0، زوم از دستیار به هوش مصنوعی فعال تکامل می‌یابد که قادر به استدلال، حافظه و اجرای وظایف است.

دستیار هوش مصنوعی تکامل‌یافته اکنون می‌تواند اقدامات چند مرحله‌ای را از طرف کاربران انجام دهد و وظایفی مانند برنامه‌ریزی جلسات، تولید کلیپ‌های ویدیویی و ایجاد اسناد را هماهنگ کند.

به‌روزرسانی‌های کلیدی عبارتند از:

  • مهارت‌های فعال: مدیریت تقویم، تولید کلیپ، کمک نوشتن پیشرفته؛
  • مدیریت وظایف: تشخیص خودکار موارد اقدام از جلسات و چت‌ها؛
  • بهبود جلسات: دستور کارهای مبتنی بر هوش مصنوعی، یادداشت‌های زنده و ضبط صدا؛
  • ایجاد سند: مراجع پیشرفته و تولید خودکار جدول داده در Zoom Docs.؛
  • نمایندگان مجازی: قابلیت‌های سلف سرویس برای خدمات مشتری با پشتیبانی چت و صدا.؛
  • راه‌حل‌های صنعت: ابزارهای تخصصی برای کارکنان خط مقدم، متخصصان مراقبت‌های بهداشتی و مربیان.؛
  • Zoom Drive: مخزن مرکزی جدید برای دارایی‌های جلسه و اسناد بهره‌وری.
  • آواتارهای سفارشی: آواتارهای ویدیویی تولید شده توسط هوش مصنوعی برای ایجاد کلیپ‌های ارائه.

بیشتر ویژگی‌ها بین مارس و ژوئیه 2025 عرضه می‌شوند. در حالی که دستیار هوش مصنوعی استاندارد بدون هزینه اضافی برای کاربران پولی گنجانده شده است، نمایندگان تخصصی و پیکربندی‌های سفارشی به هزینه‌های اضافی نیاز دارند.

هوانگ گفت: "مهم‌ترین جنبه هوش مصنوعی فعال برای ما واقعاً فعال کردن جریان اطلاعات مبتنی بر اقدام است." "معنای آن این است که وقتی جلسه‌ای دارید، وظیفه اقدام به Docs یا چت یا سایر اقداماتی که باید انجام دهید جریان می‌یابد."

استودیوی هوش مصنوعی: ساخت نمایندگان سفارشی برای شرکت‌ها

در حالی که زوم قابلیت‌های مختلف هوش مصنوعی فعال را به صورت خارج از جعبه برای کاربران ارائه می‌کند، هوانگ متوجه شد که شرکت‌ها اغلب به گزینه‌های سفارشی‌تری نیاز دارند.

اینجاست که استودیوی هوش مصنوعی وارد می‌شود و به شرکت‌ها اجازه می‌دهد نمایندگان هوش مصنوعی سفارشی را ایجاد کنند که متناسب با نیازهای تجاری خاص باشد. اینها می‌توانند عمیقاً با دانش و فرآیندهای گردش کار خاص شرکت ادغام شوند.

به عنوان مثال، هوانگ یک کاربرد عملی برای سیاست منابع انسانی را شرح داد. شرکت‌ها می‌توانند از استودیوی هوش مصنوعی برای بارگذاری تمام اسناد سیاست منابع انسانی داخلی خود استفاده کنند. سپس دستیار هوش مصنوعی روی این اطلاعات سیاست منابع انسانی خاص شرکت آموزش داده می‌شود و به آن اجازه می‌دهد تا به طور دقیق به سوالات کارمندان در مورد دستورالعمل‌ها و رویه‌های منابع انسانی پاسخ دهد.

مدیران فناوری اطلاعات همچنین می‌توانند از استودیوی هوش مصنوعی برای اتصال دستیار به سایر پایگاه‌های دانش داخلی، مانند مستندات پشتیبانی فناوری اطلاعات استفاده کنند. هدف این است که شرکت‌ها بتوانند نمایندگان هوش مصنوعی را ایجاد کنند که عمیقاً با فرآیندها، داده‌ها و گردش‌های کاری خود ادغام شده‌اند و دستیار هوش مصنوعی را به یک ابزار بهره‌وری سفارشی و ارزشمند تبدیل کنند.

پیامدهای تصمیم‌گیری در مورد هوش مصنوعی سازمانی

برای تصمیم‌گیرندگان فنی که راه‌حل‌های هوش مصنوعی بهره‌وری را ارزیابی می‌کنند، رویکرد زوم در مقایسه با جایگزین‌های مایکروسافت، گوگل و سایر فروشندگان، ملاحظات متمایزی را ارائه می‌دهد.

مدل جریان اطلاعات مبتنی بر اقدام ممکن است برای سازمان‌هایی که در آن جلسات رسانه اصلی همکاری هستند و در آن تکمیل وظایف به دلیل پراکندگی اطلاعات در ابزارهای مختلف با مشکل مواجه است، مناسب‌تر باشد. شرکت‌هایی که حجم جلسات بالایی دارند، ممکن است ارزش خاصی در توانایی زوم برای اتصال مکالمات به اقدامات بعدی پیدا کنند.

علاوه بر این، رویکرد هوش مصنوعی فدرال که SLM ها و LLM ها را ترکیب می‌کند، معماری ارزشمندی برای مطالعه ارائه می‌دهد - به طور بالقوه اقتصاد بهتری را در عین حفظ کیفیت ارائه می‌دهد. از آنجایی که هزینه‌های هوش مصنوعی به یک نگرانی فزاینده برای شرکت‌هایی تبدیل می‌شود که پیاده‌سازی‌های هوش مصنوعی خود را مقیاس‌بندی می‌کنند، این رویکرد متعادل می‌تواند تأثیرگذار باشد.

برای شرکت‌هایی که به دنبال پیشرو بودن در پذیرش هوش مصنوعی هستند، تکامل زوم از ابزار جلسه به یک پلتفرم بهره‌وری جامع، درس‌های ارزشمندی را در مورد چگونگی ساختن نقاط قوت موجود به جای صرفاً افزودن هوش مصنوعی به گردش‌های کاری موجود ارائه می‌دهد. زوم با استفاده از تسلط خود بر جلسات برای بازآفرینی کل تجربه بهره‌وری، نشان می‌دهد که چگونه می‌توان تخصص دامنه را با قابلیت‌های هوش مصنوعی ترکیب کرد تا راه‌حل‌هایی ایجاد کرد که به جای دستیاران عمومی هوش مصنوعی، به مشکلات تجاری خاص رسیدگی می‌کنند.