در تاریخ 14 مه 2024، غول فناوری گوگل، کنفرانس سالانه توسعه‌دهندگان خود با نام I/O را به صورت حضوری و آنلاین برگزار کرد. این رویداد که مملو از هیجان و نوآوری بود، شاهد معرفی محصولات و خدمات جدید متعددی از جمله هوش مصنوعی قدرتمند Gemini بود.

ستاره اصلی این رویداد، رونمایی از هوش مصنوعی جدید Gemini 1.5 Flash AI بود. این مدل جدید که به عنوان نسخه سبک‌تر و در دسترس‌تر از Gemini Pro شناخته می‌شود، مزایای قابل توجهی برای توسعه‌دهندگان به ارمغان می‌آورد.

 Gemini 1.5 Flash AI با هدف کاهش قابل توجه هزینه‌ها برای توسعه‌دهندگانی که از هوش مصنوعی در ساخت برنامه‌های خود استفاده می‌کنند، طراحی شده است. این مدل جدید در انجام وظایفی مانند خلاصه‌سازی متن، ایجاد چت‌بات، شرح تصاویر و ویدیوها، استخراج اطلاعات از اسناد و جداول و موارد دیگر، عملکردی چشمگیر ارائه می‌دهد.

تصویری از لوگو جمینی در کنار لوگو Gemini 1.5 Flash AI

علاوه بر Gemini 1.5 Flash AI، گوگل در این رویداد از چندین هوش مصنوعی دیگر نیز رونمایی کرد که هریک کاربردها و مزایای خاص خود را دارند که در ادامه به آن‌ها خواهیم پرداخت.

MusicFX DJ؛ موسیقی‌ساز دنیای جدید

موزیک اف‌ایکس، یک هوش مصنوعی مبتنی بر یادگیری ماشینی است که برای کمک به دی‌جی‌ها در انتخاب موسیقی و ایجاد میکس‌های جذاب طراحی شده است. MusicFX DJ می‌تواند با تجزیه و تحلیل سبک موسیقی مورد نظر دی‌جی، آهنگ‌های مناسب را از کتابخانه موسیقی او پیشنهاد دهد. این هوش مصنوعی می‌تواند با در نظر گرفتن تمپو، ریتم و کلید آهنگ‌ها، میکس‌های خودکار و هماهنگ را برای دی‌جی‌ها ایجاد کند. همچنین MusicFX DJ می‌تواند افکت‌های صوتی مختلفی را به میکس‌ها اضافه کند تا جذابیت آن‌ها را افزایش دهد.

مدل زبانی Astra؛ دستیار هوش مصنوعی فراگیر گوگل

در رویداد Google I/O 2024، غول فناوری گوگل از پروژه Astra رونمایی کرد که به عنوان "یک هوش مصنوعی فراگیر" معرفی شد. برخلاف سایر دستیاران هوش مصنوعی که عمدتاً بر روی وظایف خاص مانند تنظیم آلارم یا پخش موسیقی تمرکز دارند، Astra به گونه‌ای طراحی شده است که به کاربران در انجام طیف وسیعی از کارها کمک کند.

نمایش لوگو مدل زبانی Astra

Astra می‌تواند به سوالات کاربران به روشی جامع و آموزنده پاسخ دهد، حتی اگر سوالات باز، چالش برانگیز یا عجیب باشند این هوش مصنوعی، وظایف مختلفی مانند رزرو رستوران، تنظیم سفر، ارسال ایمیل و مدیریت لیست کارها را انجام خواهد داد. Astra می‌تواند به کاربران در نوشتن انواع مختلف محتوای خلاقانه مانند شعر، داستان، فیلمنامه و قطعات موسیقی کمک کند و متن و گفتار را به طور دقیق و روان بین زبان‌های مختلف ترجمه کند. در نهایت این هوش مصنوعی به گونه‌ای طراحی شده است که استفاده از آن برای هر کاربری، حتی افراد ناآشنا با هوش مصنوعی، آسان باشد.

هوش مصنوعی Veo؛ ویدیوساز خلاق با دستورات متنی

هوش مصنوعی Veo، یکی از جدیدترین دستاوردهای گوگل در زمینه هوش مصنوعی، در رویداد Google I/O 2024 رونمایی شد. این هوش مصنوعی قدرتمند، به کاربران امکان می‌دهد تا با استفاده از دستورات متنی ساده، ویدیوهای 1080p با کیفیت بالا و محتوای جذاب خلق کنند.

Imagen 3؛ تصویرساز قدرتمند گوگل

در رویداد هیجان‌انگیز Google I/O 2024، شاهد رونمایی از هوش مصنوعی تصویرساز جدیدی به نام Imagen 3 از سوی گوگل بودیم. این مدل جدید که به عنوان "قدرتمندترین هوش مصنوعی تصویرساز گوگل" معرفی شده،  قابلیت‌های چشمگیری در خلق تصاویر با کیفیت بالا و واقع‌گرایانه از متون و ایده‌های ذهنی کاربران ارائه می‌دهد.

Imagen 3 می‌تواند تصاویر با وضوح بالا و جزئیات بسیار دقیق تولید و تصاویر را در سبک‌های مختلف مانند واقع‌گرایانه، کارتونی، نقاشی و ... ایجاد کند. این هوش مصنوعی بر اساس خلاقیت شما کار می‌کند که یعنی می‌تواند با استفاده از متون و ایده‌های ذهنی کاربران، تصاویر خلاقانه و منحصر به فردی تولید کند. تصاویر ایجاد شده توسط این هوش مصنوعی، در فرمت‌های مختلف مانند jpg، png و ... ذخیره می‌شوند.

یک تصویر ساخته شده توسط هوش مصنوعی Imagen 3

علاوه‌بر تمامی این موارد، گوگل از مدل زبانی جدیدی با نام PaliGemma نیز رونمایی کرد. PaliGemma  به عنوان "اولین مدل زبانی بصری در خانواده Gemma" معرفی شده و  قابلیت‌های  جذابی را در زمینه  کار با تصاویر و ویدیوها  ارائه می‌دهد.

PaliGemma می‌تواند محتوای تصاویر و ویدیوها را به طور دقیق و جامع شرح دهد و به طور خودکار تصاویر را برچسب‌گذاری کند و موضوعات موجود در آنها را شناسایی کند. PaliGemma می‌تواند به سوالات کاربران در مورد تصاویر و ویدیوها به طور دقیق و اطلاع‌رسانی پاسخ دهد. همچنین می‌تواند بر اساس تصاویر و ویدیوها، متن‌های خلاقانه مانند شعر، داستان و فیلمنامه تولید کند.

رونمایی از تراشه Axion

گوگل در کنار رونمایی از هوش مصنوعی‌های چشمگیر در رویداد I/O 2024، از اولین پردازنده اختصاصی خود با معماری Arm به نام Axion نیز پرده برداشت. این تراشه جدید، که برای استفاده در دیتاسنترها طراحی شده، نشان‌دهنده گامی بزرگ از سوی گوگل در جهت استقلال بیشتر از تراشه‌های غول‌هایی مانند اینتل و AMD است.

این تراشه بر پایه معماری Arm Neoverse N2 طراحی شده که به دلیل عملکرد و مصرف انرژی بهینه معروف است. گوگل ادعا می‌کند که Axion در مقایسه با تراشه‌های نسل قبلی، عملکرد یادگیری ماشینی را تا 50 درصد و مصرف انرژی را تا 60 درصد کاهش می‌دهد. Axion به گونه‌ای طراحی شده که قابلیت شخصی‌سازی بالایی داشته باشد و نیازهای خاص دیتاسنترها را برآورده کند. همچنین گوگل از هوش مصنوعی برای طراحی و بهینه‌سازی عملکرد Axion استفاده کرده است.

رویداد I/O 2024 گوگل، بار دیگر بر تعهد این شرکت به نوآوری در حوزه هوش مصنوعی تأکید کرد. معرفی مدل‌های جدیدی مانند Gemini 1.5 Flash AI، نویدبخش تحولات عظیمی در صنایع مختلف و ارتقای سطح زندگی بشر است.