نمونه‌ای از خروجی تحلیل داده با عامل هوش مصنوعی
نمونه‌ای از خروجی تحلیل داده با عامل هوش مصنوعی

آموزش ساخت عامل علم داده: پیاده‌سازی کد با استفاده از مدل gemini-2.0-flash-lite از طریق Google API، google.generativeai، Pandas و IPython.display برای تحلیل داده تعاملی

در این آموزش، ما یکپارچه‌سازی کتابخانه قدرتمند پایتون برای دستکاری داده‌ها، Pandas، با قابلیت‌های پیشرفته مولد Google Cloud از طریق بسته google.generativeai و مدل Gemini Pro را نشان می‌دهیم. با تنظیم محیط با کتابخانه‌های لازم، پیکربندی کلید Google Cloud API و استفاده از قابلیت‌های نمایش IPython، این کد یک رویکرد گام به گام برای ساخت یک عامل علم داده ارائه می‌دهد که یک مجموعه داده فروش نمونه را تحلیل می‌کند. این مثال نشان می‌دهد که چگونه یک دیتافریم (DataFrame) را به فرمت مارک‌داون تبدیل کرده و سپس از پرس‌وجوهای زبان طبیعی برای تولید بینش در مورد داده‌ها استفاده کنیم، که پتانسیل ترکیب ابزارهای تحلیل داده سنتی با روش‌های مدرن مبتنی بر هوش مصنوعی را برجسته می‌کند.

ابتدا، کتابخانه‌های Pandas و google.generativeai را به صورت بی‌صدا (quiet) نصب می‌کنیم تا محیط را برای دستکاری داده و تحلیل مبتنی بر هوش مصنوعی آماده کنیم.

ما Pandas را برای دستکاری داده، google.generativeai را برای دسترسی به قابلیت‌های هوش مصنوعی مولد گوگل و Markdown را از IPython.display برای نمایش خروجی‌های فرمت‌شده با مارک‌داون وارد می‌کنیم.

ما یک کلید API جایگزین اختصاص می‌دهیم، کلاینت google.generativeai را با آن پیکربندی می‌کنیم و مدل GenerativeModel با نام ‘gemini-2.0-flash-lite’ را برای تولید محتوا مقداردهی اولیه می‌کنیم.

در اینجا، یک دیتافریم Pandas به نام sales_df ایجاد می‌کنیم که حاوی داده‌های فروش نمونه برای محصولات مختلف است و سپس دیتافریم را همراه با یک خط جداکننده برای تمایز بصری خروجی چاپ می‌کنیم.

در اینجا، ما یک پرامپت (prompt) با فرمت مارک‌داون از یک دیتافریم Pandas و یک پرس‌وجوی زبان طبیعی می‌سازیم، سپس از مدل Gemini Pro برای تولید و بازگرداندن یک پاسخ تحلیلی استفاده می‌کنیم.

خروجی پرس‌وجوی ۲: محصول با بیشترین فروش
<strong>خروجی پرس‌وجوی ۲</strong>
خروجی پرس‌وجوی ۳: میانگین قیمت
<strong>خروجی پرس‌وجوی ۳</strong>
خروجی پرس‌وجوی ۴: محصولات منطقه شمال
<strong>خروجی پرس‌وجوی ۴</strong>
خروجی پرس‌وجوی ۵: درآمد کل هر محصول
<strong>خروجی پرس‌وجوی ۵</strong>

در نتیجه، این آموزش با موفقیت نشان می‌دهد که چگونه هم‌افزایی بین Pandas، بسته google.generativeai و مدل Gemini Pro می‌تواند وظایف تحلیل داده را به فرآیندی تعاملی‌تر و بینش‌محورتر تبدیل کند. این رویکرد، پرس‌وجو و تفسیر داده‌ها را ساده می‌کند و راه‌هایی را برای موارد استفاده پیشرفته مانند پاکسازی داده‌ها، مهندسی ویژگی‌ها و تحلیل داده اکتشافی باز می‌کند. با بهره‌گیری از این ابزارهای پیشرفته در اکوسیستم آشنای پایتون، دانشمندان داده می‌توانند بهره‌وری و نوآوری خود را افزایش دهند و استخراج بینش‌های معنادار از مجموعه داده‌های پیچیده را آسان‌تر کنند.

اینجا دفترچه Colab موجود است. همچنین، فراموش نکنید که ما را در توییتر دنبال کنید و به کانال تلگرام و گروه لینکدین ما بپیوندید. فراموش نکنید به ساب‌ردیت یادگیری ماشین با بیش از ۸۵ هزار عضو ما ملحق شوید.