هفته گذشته در هوش مصنوعی
توسط هفته گذشته در هوش مصنوعی
گوگل DeepMind مدل ویدئویی جدیدی برای رقابت با Sora معرفی کرد
DeepMind اعلام کرد که Veo 2، یک مدل هوش مصنوعی تولید ویدئو نسل بعدی است که میتواند کلیپهای دو دقیقهای با وضوح تا 4K ایجاد کند و از نظر وضوح و مدت زمان از Sora شرکت OpenAI پیشی بگیرد. Veo 2 که بهطور انحصاری در ابزار آزمایشی تولید ویدئوی گوگل، VideoFX، در دسترس است، درک بهتری از فیزیک و کنترلهای دوربین دارد و تصاویر واضحتری تولید میکند. این مدل میتواند حرکت، دینامیک سیالات و خواص نور را بهطور واقعیتری مدلسازی کند، از جمله لنزهای مختلف و افکتهای سینمایی. شرکت همچنین ارتقاءهایی برای Imagen 3، مدل تولید تصویر تجاری خود، اعلام کرد که میتواند تصاویر و عکسهای روشنتر و بهتر ترکیبشدهای در سبکهای مختلف ایجاد کند.
آزمایشگاههای Pika نسخه 2.0 از تولیدکننده ویدئوی هوش مصنوعی خود را منتشر کرده است که ویژگی مهمی به نام "مواد صحنه" را معرفی میکند که به کاربران امکان میدهد تصاویر خود را در ویدئوهای تولید شده توسط هوش مصنوعی وارد کنند. این ابزار هوش مصنوعی به کاربران اجازه میدهد صحنهها را از اجزای بصری مختلف مانند تصاویر افراد، اشیاء، لباسها یا محیطها بسازند و هوش مصنوعی سپس هدف هر تصویر را تعیین کرده و آنها را در یک صحنه کاربردی ادغام میکند. این تولیدکننده ویدئوی بهروزرسانی شده که همچنین کیفیت بصری بهبود یافته و تطابق با درخواستهای بهتر را داراست، برای همه کاربران، از جمله کسانی که در اتحادیه اروپا هستند، در دسترس خواهد بود، در حالی که Sora شرکت OpenAI فقط به مشترکین Pro بهطور کامل در دسترس است.
DeepMind پروژه Mariner را معرفی کرده است، یک عامل هوش مصنوعی که میتواند به نمایندگی از کاربران با وب تعامل داشته باشد. عامل مبتنی بر Gemini میتواند مرورگر Chrome را کنترل کند، نشانگر را حرکت دهد، دکمهها را کلیک کند و فرمها را پر کند، و تعامل انسانی با وبسایتها را تقلید کند. این عامل که در حال حاضر توسط گروه کوچکی آزمایش میشود، میتواند وظایفی مانند ایجاد سبد خرید از لیست خرید یا یافتن پروازها و هتلها را انجام دهد. با این حال، نمیتواند اطلاعات کارت اعتباری را پر کند یا کوکیها را به نمایندگی از کاربران بپذیرد. این عامل بر روی فعالترین تب مرورگر Chrome کار میکند، به این معنی که کاربران باید تماشا کنند که عامل وظایف را انجام میدهد.
آزمایشگاههای Pika نسخه 2.0 تولیدکننده ویدئوی هوش مصنوعی خود را با ویژگیهای جدید منتشر کرد
گوگل پروژه Mariner را معرفی کرد: عوامل هوش مصنوعی برای استفاده از وب برای شما
مایکروسافت Phi-4، یک مدل جدید هوش مصنوعی تولیدی، را در پیشنمایش تحقیقاتی معرفی کرد
مایکروسافت Phi-4، جدیدترین افزوده به سری مدلهای هوش مصنوعی تولیدی Phi خود را معرفی کرده است که بهویژه در حل مسائل ریاضی به دلیل بهبود کیفیت دادههای آموزشی مهارت دارد. این مدل که شامل ۱۴ میلیارد پارامتر است، در حال حاضر در دسترسی محدود بر روی پلتفرم توسعه Azure AI Foundry مایکروسافت برای اهداف تحقیقاتی در دسترس است. عملکرد بهبود یافته Phi-4 به استفاده از مجموعه دادههای مصنوعی با کیفیت بالا و محتوای تولید شده توسط انسان، و همچنین بهبودهای پس از آموزش نامشخص نسبت داده میشود. این انتشار اولین راهاندازی مدل سری Phi از زمان خروج Sébastien Bubeck، یک چهره کلیدی در توسعه مدل Phi مایکروسافت، که شرکت را ترک کرد تا به OpenAI بپیوندد، را نشان میدهد.