هفته گذشته در هوش مصنوعی

گوگل DeepMind مدل ویدئویی جدیدی برای رقابت با Sora معرفی کرد

DeepMind اعلام کرد که Veo 2، یک مدل هوش مصنوعی تولید ویدئو نسل بعدی است که می‌تواند کلیپ‌های دو دقیقه‌ای با وضوح تا 4K ایجاد کند و از نظر وضوح و مدت زمان از Sora شرکت OpenAI پیشی بگیرد. Veo 2 که به‌طور انحصاری در ابزار آزمایشی تولید ویدئوی گوگل، VideoFX، در دسترس است، درک بهتری از فیزیک و کنترل‌های دوربین دارد و تصاویر واضح‌تری تولید می‌کند. این مدل می‌تواند حرکت، دینامیک سیالات و خواص نور را به‌طور واقعی‌تری مدل‌سازی کند، از جمله لنزهای مختلف و افکت‌های سینمایی. شرکت همچنین ارتقاءهایی برای Imagen 3، مدل تولید تصویر تجاری خود، اعلام کرد که می‌تواند تصاویر و عکس‌های روشن‌تر و بهتر ترکیب‌شده‌ای در سبک‌های مختلف ایجاد کند.

آزمایشگاه‌های Pika نسخه 2.0 از تولیدکننده ویدئوی هوش مصنوعی خود را منتشر کرده است که ویژگی مهمی به نام "مواد صحنه" را معرفی می‌کند که به کاربران امکان می‌دهد تصاویر خود را در ویدئوهای تولید شده توسط هوش مصنوعی وارد کنند. این ابزار هوش مصنوعی به کاربران اجازه می‌دهد صحنه‌ها را از اجزای بصری مختلف مانند تصاویر افراد، اشیاء، لباس‌ها یا محیط‌ها بسازند و هوش مصنوعی سپس هدف هر تصویر را تعیین کرده و آن‌ها را در یک صحنه کاربردی ادغام می‌کند. این تولیدکننده ویدئوی به‌روزرسانی شده که همچنین کیفیت بصری بهبود یافته و تطابق با درخواست‌های بهتر را داراست، برای همه کاربران، از جمله کسانی که در اتحادیه اروپا هستند، در دسترس خواهد بود، در حالی که Sora شرکت OpenAI فقط به مشترکین Pro به‌طور کامل در دسترس است.

DeepMind پروژه Mariner را معرفی کرده است، یک عامل هوش مصنوعی که می‌تواند به نمایندگی از کاربران با وب تعامل داشته باشد. عامل مبتنی بر Gemini می‌تواند مرورگر Chrome را کنترل کند، نشانگر را حرکت دهد، دکمه‌ها را کلیک کند و فرم‌ها را پر کند، و تعامل انسانی با وب‌سایت‌ها را تقلید کند. این عامل که در حال حاضر توسط گروه کوچکی آزمایش می‌شود، می‌تواند وظایفی مانند ایجاد سبد خرید از لیست خرید یا یافتن پروازها و هتل‌ها را انجام دهد. با این حال، نمی‌تواند اطلاعات کارت اعتباری را پر کند یا کوکی‌ها را به نمایندگی از کاربران بپذیرد. این عامل بر روی فعال‌ترین تب مرورگر Chrome کار می‌کند، به این معنی که کاربران باید تماشا کنند که عامل وظایف را انجام می‌دهد.

آزمایشگاه‌های Pika نسخه 2.0 تولیدکننده ویدئوی هوش مصنوعی خود را با ویژگی‌های جدید منتشر کرد

گوگل پروژه Mariner را معرفی کرد: عوامل هوش مصنوعی برای استفاده از وب برای شما

مایکروسافت Phi-4، یک مدل جدید هوش مصنوعی تولیدی، را در پیش‌نمایش تحقیقاتی معرفی کرد

مایکروسافت Phi-4، جدیدترین افزوده به سری مدل‌های هوش مصنوعی تولیدی Phi خود را معرفی کرده است که به‌ویژه در حل مسائل ریاضی به دلیل بهبود کیفیت داده‌های آموزشی مهارت دارد. این مدل که شامل ۱۴ میلیارد پارامتر است، در حال حاضر در دسترسی محدود بر روی پلتفرم توسعه Azure AI Foundry مایکروسافت برای اهداف تحقیقاتی در دسترس است. عملکرد بهبود یافته Phi-4 به استفاده از مجموعه داده‌های مصنوعی با کیفیت بالا و محتوای تولید شده توسط انسان، و همچنین بهبودهای پس از آموزش نامشخص نسبت داده می‌شود. این انتشار اولین راه‌اندازی مدل سری Phi از زمان خروج Sébastien Bubeck، یک چهره کلیدی در توسعه مدل Phi مایکروسافت، که شرکت را ترک کرد تا به OpenAI بپیوندد، را نشان می‌دهد.