ایجنت های هوش مصنوعی بسیار محبوب هستند، اما در مورد یک ایجنت که به طور خاص بر تجزیه و تحلیل، مرتب سازی و نتیجه گیری از حجم عظیمی از داده ها متمرکز است، چطور؟
ایجنت علم داده گوگل دقیقاً همین کار را انجام می دهد: دستیار هوش مصنوعی جدید و رایگان مبتنی بر Gemini 2.0 که تجزیه و تحلیل داده ها را خودکار می کند، اکنون برای کاربران بالای 18 سال در کشورهای و زبان های منتخب به صورت رایگان در دسترس است.
این دستیار از طریق Google Colab در دسترس است، سرویس هشت ساله این شرکت برای اجرای کد پایتون به صورت زنده آنلاین در بالای واحدهای پردازش گرافیکی (GPU) متعلق به غول جستجو و واحدهای پردازش تانسور (TPU) داخلی خود.
ایجنت علم داده که در ابتدا برای آزمایشکنندگان مورد اعتماد در دسامبر 2024 راهاندازی شد، برای کمک به محققان، دانشمندان داده و توسعهدهندگان برای سادهسازی گردش کار خود با تولید نوتبوکهای Jupyter کاملاً کاربردی از توضیحات زبان طبیعی، همگی در مرورگر کاربر طراحی شده است.
این گسترش با تلاش های مداوم گوگل برای ادغام ویژگی های کدنویسی و علم داده مبتنی بر هوش مصنوعی در Colab، بر اساس بهروزرسانیهای گذشته مانند کمک کدنویسی هوش مصنوعی مبتنی بر Codey که در مه 2023 اعلام شد، مطابقت دارد.
همچنین به عنوان نوعی پاسخ پیشرفته و دیرهنگام به تجزیه و تحلیل داده های پیشرفته ChatGPT (قبلاً Code Interpreter) عمل می کند که اکنون هنگام اجرای GPT-4 در ChatGPT ساخته شده است.
Google Colab چیست؟
Google Colab (مخفف colaboratory) یک محیط Jupyter Notebook مبتنی بر ابر است که کاربران را قادر می سازد تا کد پایتون را مستقیماً در مرورگر خود بنویسند و اجرا کنند.
Jupyter Notebook یک برنامه وب منبع باز است که کاربران را قادر می سازد اسنادی حاوی کد زنده، معادلات، تصاویر و متن روایی ایجاد و به اشتراک بگذارند. این پلتفرم تعاملی که در سال 2014 از پروژه IPython سرچشمه گرفت، اکنون از بیش از 40 زبان برنامه نویسی، از جمله پایتون، R و Julia پشتیبانی می کند. این پلتفرم تعاملی به طور گسترده در علم داده، تحقیق و آموزش برای کارهایی مانند تجزیه و تحلیل داده ها، تصویرسازی و آموزش مفاهیم برنامه نویسی استفاده می شود.
Google Colab از زمان راه اندازی خود در سال 2017، به یکی از پرکاربردترین پلتفرم ها برای یادگیری ماشین (ML)، علم داده و آموزش تبدیل شده است.
همانطور که Ori Abramovsky، رهبر علم داده در Spectralops.io، در یک پست عالی در Medium از سال 2023 توضیح داد، سهولت استفاده و دسترسی رایگان Colab به GPU ها و TPU ها آن را به گزینه ای برجسته برای بسیاری از توسعه دهندگان و محققان تبدیل کرده است.
وی خاطرنشان کرد که مانع کم ورود، ادغام یکپارچه با Google Drive و پشتیبانی از TPU ها به تیم او اجازه داد تا به طور چشمگیری چرخه های آموزشی را در حین کار بر روی مدل های هوش مصنوعی کوتاه کنند.
با این حال، Abramovsky همچنین به محدودیت های Colab اشاره کرد، مانند:
- محدودیت های زمانی جلسه (به ویژه برای کاربران سطح رایگان).
- تخصیص غیرقابل پیش بینی منابع در زمان های اوج استفاده.
- فقدان ویژگی های حیاتی، مانند اجرای کارآمد خط لوله و زمان بندی پیشرفته.
- چالش های پشتیبانی، زیرا گوگل گزینه های محدودی برای کمک مستقیم ارائه می دهد.
علیرغم این معایب، Abramovsky تاکید کرد که Colab همچنان یکی از بهترین راه حل های نوت بوک بدون سرور موجود است - به ویژه در مراحل اولیه پروژه های ML و تجزیه و تحلیل داده ها.
ساده سازی تجزیه و تحلیل داده ها با هوش مصنوعی
ایجنت علم داده با حذف نیاز به تنظیم دستی، بر محیط نوت بوک بدون سرور Colab تکیه می کند.
با استفاده از هوش مصنوعی Gemini گوگل، کاربران می توانند اهداف تحلیلی خود را به زبان انگلیسی ساده توصیف کنند ("تجسم روندها"، "آموزش یک مدل پیش بینی"، "پاکسازی مقادیر از دست رفته")، و ایجنت در پاسخ نوت بوک های Colab کاملاً قابل اجرا تولید می کند.
این به کاربران با:
- خودکارسازی تجزیه و تحلیل: نوت بوک های کامل و کاربردی به جای قطعه کد های مجزا تولید می کند.
- صرفه جویی در زمان: حذف تنظیم دستی و کدنویسی تکراری.
- بهبود همکاری: دارای ویژگی های اشتراک گذاری داخلی برای پروژه های تیمی است.
- ارائه راه حل های قابل تغییر: کاربران می توانند کد تولید شده را تنظیم و سفارشی کنند.
ایجنت علم داده در حال حاضر تحقیقات علمی دنیای واقعی را تسریع می کند
به گفته گوگل، آزمایشکنندگان اولیه هنگام استفاده از ایجنت علم داده، صرفهجویی قابل توجهی در زمان گزارش کردهاند.
به عنوان مثال، یک دانشمند در آزمایشگاه ملی لارنس برکلی که روی انتشار متان تالاب های گرمسیری کار می کرد، تخمین زد که زمان پردازش داده های آنها هنگام استفاده از ایجنت از یک هفته به تنها پنج دقیقه کاهش یافته است.
این ابزار همچنین در معیارهای صنعت عملکرد خوبی داشته است و در DABStep: معیار ایجنت داده برای استدلال چند مرحله ای در Hugging Face، جلوتر از ایجنت های هوش مصنوعی مانند ReAct (GPT-4.0)، Deepseek، Claude 3.5 Haiku و Llama 3.3 70B رتبه چهارم را کسب کرده است.
با این حال، مدل های رقیب o3-mini و o1 OpenAI، و همچنین Claude 3.5 Sonnet از Anthropic، هر دو از ایجنت علم داده جدید Gemini بهتر عمل کردند.
شروع شدن
کاربران می توانند با دنبال کردن این مراحل شروع به استفاده از ایجنت علم داده در Google Colab کنند:
- یک نوت بوک Colab جدید باز کنید.
- یک مجموعه داده آپلود کنید (CSV، JSON و غیره).
- تجزیه و تحلیل را به زبان طبیعی با استفاده از پانل جانبی Gemini توصیف کنید.
- نوت بوک تولید شده را اجرا کنید تا بینش ها و تصاویر را ببینید.
گوگل مجموعه داده های نمونه و ایده های سریع را برای کمک به کاربران برای کاوش در قابلیت های خود ارائه می دهد، از جمله:
- نظرسنجی توسعه دهندگان Stack Overflow: "محبوب ترین زبان های برنامه نویسی را تجسم کنید."
- مجموعه داده گونه های Iris: "همبستگی های پیرسون، اسپیرمن و کندال را محاسبه و تجسم کنید."
- مجموعه داده طبقه بندی شیشه: "یک طبقه بندی کننده جنگل تصادفی آموزش دهید."
هر زمان که یک کاربر بخواهد از ایجنت جدید استفاده کند، باید به Colab رفته و روی "file" و سپس "new notebook in drive" کلیک کند و نوت بوک حاصل در حساب ابری Google Drive آنها ذخیره می شود.
دموی کوتاه خودم ترکیبی تر بود
البته، من یک روزنامه نگار فناوری فروتن هستم و دانشمند داده نیستم، اما استفاده خودم از ایجنت علم داده جدید Gemini 2.0 در Colab تا کنون کمتر از یکپارچه بوده است.
من پنج فایل CSV (مقادیر جدا شده با کاما، فایل های صفحه گسترده استاندارد از Excel یا Sheets) را آپلود کردم و از آن پرسیدم "هر ماه و سه ماه چقدر برای خدمات رفاهی خود هزینه می کنم؟".
ایجنت پیش رفت و عملیات زیر را انجام داد:
- ادغام مجموعه داده ها، رسیدگی به ناسازگاری های تاریخ و شماره حساب.
- فیلتر و پاکسازی داده ها، اطمینان از اینکه فقط هزینه های مربوطه باقی مانده اند.
- گروه بندی تراکنش ها بر اساس ماه و سه ماه برای محاسبه هزینه ها.
- تولید تصاویر، مانند نمودارهای خطی برای تجزیه و تحلیل روند.
- خلاصه یافته ها در یک گزارش واضح و ساختاریافته.
قبل از اجرا، Colab یک پیام تأیید را اعلام کرد و به من یادآوری کرد که ممکن است با API های خارجی تعامل داشته باشد.
همه این کارها را خیلی سریع و روان در مرورگر، در عرض چند ثانیه انجام داد. و تماشای آن در حین کار از طریق تجزیه و تحلیل و برنامه نویسی با توضیحات گام به گام قابل مشاهده از کاری که انجام می داد، چشمگیر بود.
با این حال، در نهایت یک نمودار نادرست تولید کرد که فقط هزینه های رفاهی یک ماه را نشان می داد و نتوانست تشخیص دهد که برگه ها شامل ارزش یک سال کامل تقسیم شده بر اساس ماه ها است. وقتی از او خواستم تجدید نظر کند، با خوشحالی تلاش کرد، اما در نهایت نتوانست رشته کد صحیح را برای پاسخ به درخواست من تولید کند.
قیمت گذاری Colab و ویژگی های هوش مصنوعی
در حالی که Google Colab رایگان باقی می ماند، کاربرانی که به قدرت محاسباتی بیشتری نیاز دارند می توانند به برنامه های پولی ارتقا دهند:
- Colab pro ($9.99/month): 100 واحد محاسباتی، GPU های سریع تر، حافظه بیشتر، دسترسی ترمینال.
- Colab pro+ ($49.99/month): 500 واحد محاسباتی، ارتقاء GPU اولویت دار، اجرای پس زمینه.
- Colab enterprise: ادغام Google Cloud، تولید کد مبتنی بر هوش مصنوعی.
- پرداخت به ازای مصرف: 9.99 دلار برای 100 واحد محاسباتی، 49.99 دلار برای 500 واحد محاسباتی.
علاوه بر ایجنت علم داده، گوگل در حال گسترش قابلیت های هوش مصنوعی در Colab بوده است.
گوگل درخواستها، کد تولید شده و بازخورد کاربران را برای بهبود مدلهای هوش مصنوعی خود جمعآوری میکند. در حالی که دادهها تا 18 ماه ذخیره میشوند، ناشناس هستند و ممکن است درخواستهای حذف همیشه برآورده نشوند. به کاربران توصیه میشود اطلاعات حساس یا شخصی را ارسال نکنند، زیرا ممکن است بازبینهای انسانی درخواستها را پردازش کنند. علاوه بر این، کد تولید شده توسط هوش مصنوعی باید با دقت بررسی شود، زیرا ممکن است حاوی اشتباهاتی باشد.
بازخورد خوش آمدید
گوگل کاربران را تشویق می کند تا از طریق انجمن Google Labs Discord در کانال #data-science-agent بازخورد ارائه دهند.
با تبدیل شدن اتوماسیون مبتنی بر هوش مصنوعی به یک روند کلیدی در علم داده، ایجنت علم داده گوگل در Colab می تواند به محققان و توسعه دهندگان کمک کند تا بیشتر بر بینش ها و کمتر بر تنظیمات کدنویسی تمرکز کنند. از آنجایی که این ابزار به کاربران و مناطق بیشتری گسترش می یابد، جالب خواهد بود که ببینیم چگونه آینده تجزیه و تحلیل با کمک هوش مصنوعی را شکل می دهد.