منبع تصویر: GPT-4o / The Rundown
منبع تصویر: GPT-4o / The Rundown

اتحاد رقبای بزرگ تراشه‌سازی

به‌علاوه: چگونه سبک‌های تصویری را با GPT-4o منتقل کنیم

صبح بخیر، علاقه‌مندان به هوش مصنوعی. شرایط دشوار نیازمند مشارکت‌های غافلگیرکننده است؛ گزارش‌ها حاکی از آن است که اینتلِ درگیر مشکلات، به یک اتحاد استراتژیک در تولید تراشه‌های هوش مصنوعی با رقیب دیرینه خود، TSMC، نزدیک می‌شود.

در حالی که این غول فناوری به دنبال تثبیت وضعیت خود پس از زیان‌های سنگین است، آیا این مشارکت، آغاز عصر جدیدی در صنعت نیمه‌هادی‌ها در ایالات متحده است - یا فصل پایانی میراث اینتل؟

یادآوری: کارگاه بعدی ما امروز ساعت ۴ بعد از ظهر به وقت شرقی (EST) برگزار می‌شود — شرکت کنید و بیاموزید که چگونه از مهارت‌های تصویری پرطرفدار GPT-4o به طور مؤثر در کار خود استفاده کنید!

اینتل و TSMC

خلاصه خبر: طبق گزارشی از The Information، اینتل گزارش شده است که در حال تشکیل یک مشارکت استراتژیک با رقیب تراشه‌ساز خود، TSMC، است — در توافقی که یک عملیات مشترک برای اداره تأسیسات تولیدی این رهبر نیمه‌هادی‌های ایالات متحده که با مشکلات دست و پنجه نرم می‌کند، ایجاد خواهد کرد.

جزئیات:

  • گفته می‌شود کاخ سفید مذاکراتی را بین این دو رقیب ترتیب داده است و TSMC به طور بالقوه ۲۰ درصد از سهام این سرمایه‌گذاری مشترک جدید را به دست خواهد آورد.
  • به جای سرمایه‌گذاری نقدی، TSMC تخصص تولیدی و برنامه‌های آموزشی خود را برای کمک به احیای قابلیت‌های تولید اینتل ارائه خواهد داد.
  • این توافق با مقاومت داخلی مدیران اینتل که نگران اخراج‌ها و آینده فناوری تولید خود اینتل هستند، مواجه است.
  • لیپ-بو تان (Lip-Bu Tan)، مدیرعامل تازه منصوب شده اینتل، پس از زیان ۱۶ میلیارد دلاری در سال ۲۰۲۴، برای ایجاد تغییرات اساسی در رویکرد تولید شرکت تلاش کرده است.

اهمیت موضوع: اینتل برای احیای کسب‌وکار خود به یکی از بزرگترین رقبایش روی آورده است. دسترسی به تکنیک‌های تولید پیشرو در جهان TSMC می‌تواند یک راه نجات بزرگ برای این تراشه‌سازِ درگیر مشکلات فراهم کند، در حالی که TSMC در زمان افزایش تنش‌های ژئوپلیتیکی پیرامون زنجیره‌های تأمین فناوری، جایگاه قوی‌تری در ایالات متحده به دست می‌آورد.

ابزار گسترش ویدئو با هوش مصنوعی ادوبی پریمیر پرو (Generative Extend)
منبع تصویر: ادوبی

ادوبی (Adobe)

خلاصه خبر: ادوبی به تازگی اولین ویژگی هوش مصنوعی مبتنی بر Firefly خود را در پریمیر پرو به نام Generative Extend منتشر کرده است که به ویرایشگران اجازه می‌دهد کلیپ‌های ویدئویی و صوتی را به طور خودکار با کیفیت 4K گسترش دهند — این قابلیت در کنار قابلیت‌های جدید جستجو و ترجمه با هوش مصنوعی ارائه می‌شود.

جزئیات:

  • ابزار جدید Generative Extend به ویرایشگران امکان می‌دهد کلیپ‌های ویدئویی و صوتی را طولانی‌تر کنند، و هوش مصنوعی فریم‌های اضافی را برای ایجاد گسترش‌های یکپارچه پر می‌کند.
  • این ابزار اکنون از وضوح 4K و فرمت‌های ویدئوی عمودی پشتیبانی می‌کند و می‌تواند صدای محیط را تا ده ثانیه به طور مستقل یا دو ثانیه همراه با ویدئو گسترش دهد.
  • یک پنل جستجوی Media Intelligence محتوایی مانند افراد، اشیاء و زوایای دوربین را در کلیپ‌ها شناسایی می‌کند و به کاربران امکان می‌دهد فیلم‌ها را از طریق زبان طبیعی جستجو کنند.
  • ویژگی جدید ترجمه زیرنویس (Caption Translation) فوراً زیرنویس‌ها را به ۲۷ زبان مختلف تبدیل می‌کند و نیاز به ترجمه‌های دستی را از بین می‌برد.

اهمیت موضوع: ادوبی به جای تمرکز بر تولید کامل ویدئو، با ادغام هدفمند هوش مصنوعی، نقاط درد خاصی را در گردش کار حرفه‌ای برطرف می‌کند. ابزارهایی مانند گسترش کلیپ‌ها بدون نیاز به فیلمبرداری مجدد، یافتن سریع فیلم و ترجمه فوری زیرنویس‌ها، نشان‌دهنده تغییرات عمده در گردش کار هستند — که ضمن حفظ کنترل خلاقانه، باعث صرفه‌جویی در زمان می‌شوند.

نمونه‌ای از انتقال سبک بین تصاویر با استفاده از GPT-4o
انتقال سبک بین تصاویر با GPT-4o

آموزش هوش مصنوعی

خلاصه: ویژگی جدید تولید تصویر بومی ChatGPT می‌تواند سبک‌ها را بین تصاویر منتقل کند و به شما امکان می‌دهد به راحتی زیبایی‌شناسی یک تصویر را به تصویر دیگر اعمال کنید و نتایج چشمگیری به دست آورید.

مراحل انجام کار:

  1. به ChatGPT مراجعه کنید و از گزینه‌های منو «Create Image» (ایجاد تصویر) را انتخاب کنید.
  2. هم تصویر مرجع سبک خود (ظاهری که می‌خواهید از آن الهام بگیرید) و هم تصویر محتوای خود (تصویری که می‌خواهید تغییر دهید) را آپلود کنید.
  3. یک دستور (prompt) مشخص ایجاد کنید، مانند: «سبک بصری، نورپردازی و ترکیب‌بندی تصویر اول را به تصویر دوم اعمال کن.»
  4. نتیجه تولید شده را بررسی کنید و در صورت نیاز با دستورالعمل‌های بعدی آن را اصلاح کنید.

نکته حرفه‌ای: برای بهترین نتایج، در مورد اینکه کدام عناصر سبک (رنگ‌ها، نورپردازی، ترکیب‌بندی) را می‌خواهید منتقل کنید، بسیار مشخص باشید و تصاویر مرجعی با ویژگی‌های بصری متمایز انتخاب کنید.

تصویری مفهومی نشان‌دهنده پنهان‌کاری مدل هوش مصنوعی در استدلال
منبع تصویر: Reve / The Rundown AI

تحقیقات هوش مصنوعی

خلاصه خبر: یک مطالعه جدید از تیم علوم هم‌ترازی (Alignment Science Team) انتروپیک نشان داد که مدل‌های هوش مصنوعی هنگام توضیح پاسخ‌ها به کاربر، اغلب فرایندهای استدلال واقعی خود را پنهان می‌کنند، که این موضوع نگرانی‌هایی را در مورد توانایی ما برای نظارت و درک تصمیم‌گیری هوش مصنوعی ایجاد می‌کند.

جزئیات:

  • این تحقیق، مدل‌های Claude 3.7 Sonnet و DeepSeek R1 را از نظر وفاداری زنجیره-تفکر (chain-of-thought faithfulness) ارزیابی کرد و سنجید که چقدر صادقانه مراحل استدلال خود را توضیح می‌دهند.
  • به مدل‌ها نکاتی مانند پیشنهادات کاربر، فراداده‌ها یا الگوهای بصری ارائه شد و زنجیره-تفکر (CoT) برای پذیرش استفاده از آن‌ها هنگام توضیح پاسخ‌ها بررسی شد.
  • عملکرد مدل‌های استدلالی بهتر از نسخه‌های قبلی بود، اما همچنان در تست‌ها تا ۸۰ درصد مواقع استدلال واقعی خود را پنهان می‌کردند.
  • این مطالعه همچنین نشان داد که مدل‌ها در توضیح استدلال خود در مورد سؤالات دشوارتر نسبت به سؤالات ساده‌تر، وفاداری کمتری داشتند.

اهمیت موضوع: نظارت بر زنجیره-تفکر (CoT) به عنوان یک مکانیسم کلیدی در تشخیص فرایندهای هوش مصنوعی مطرح شده است، اما اگر مدل‌ها به طور قابل اعتمادی استدلال واقعی خود را بیان نکنند (حتی برای تصمیم‌گیری‌های ساده)، چگونه می‌توانیم به آن برای آشکار کردن رفتارهای پیچیده‌تر و بالقوه فاجعه‌بار اعتماد کنیم؟ به نظر می‌رسد «جعبه سیاه» هوش مصنوعی هنوز تا کالبدشکافی کامل فاصله زیادی دارد.