در تاریخ 14 مه 2024، غول فناوری گوگل، کنفرانس سالانه توسعهدهندگان خود با نام I/O را به صورت حضوری و آنلاین برگزار کرد. این رویداد که مملو از هیجان و نوآوری بود، شاهد معرفی محصولات و خدمات جدید متعددی از جمله هوش مصنوعی قدرتمند Gemini بود.
ستاره اصلی این رویداد، رونمایی از هوش مصنوعی جدید Gemini 1.5 Flash AI بود. این مدل جدید که به عنوان نسخه سبکتر و در دسترستر از Gemini Pro شناخته میشود، مزایای قابل توجهی برای توسعهدهندگان به ارمغان میآورد.
Gemini 1.5 Flash AI با هدف کاهش قابل توجه هزینهها برای توسعهدهندگانی که از هوش مصنوعی در ساخت برنامههای خود استفاده میکنند، طراحی شده است. این مدل جدید در انجام وظایفی مانند خلاصهسازی متن، ایجاد چتبات، شرح تصاویر و ویدیوها، استخراج اطلاعات از اسناد و جداول و موارد دیگر، عملکردی چشمگیر ارائه میدهد.
علاوه بر Gemini 1.5 Flash AI، گوگل در این رویداد از چندین هوش مصنوعی دیگر نیز رونمایی کرد که هریک کاربردها و مزایای خاص خود را دارند که در ادامه به آنها خواهیم پرداخت.
MusicFX DJ؛ موسیقیساز دنیای جدید
موزیک افایکس، یک هوش مصنوعی مبتنی بر یادگیری ماشینی است که برای کمک به دیجیها در انتخاب موسیقی و ایجاد میکسهای جذاب طراحی شده است. MusicFX DJ میتواند با تجزیه و تحلیل سبک موسیقی مورد نظر دیجی، آهنگهای مناسب را از کتابخانه موسیقی او پیشنهاد دهد. این هوش مصنوعی میتواند با در نظر گرفتن تمپو، ریتم و کلید آهنگها، میکسهای خودکار و هماهنگ را برای دیجیها ایجاد کند. همچنین MusicFX DJ میتواند افکتهای صوتی مختلفی را به میکسها اضافه کند تا جذابیت آنها را افزایش دهد.
مدل زبانی Astra؛ دستیار هوش مصنوعی فراگیر گوگل
در رویداد Google I/O 2024، غول فناوری گوگل از پروژه Astra رونمایی کرد که به عنوان "یک هوش مصنوعی فراگیر" معرفی شد. برخلاف سایر دستیاران هوش مصنوعی که عمدتاً بر روی وظایف خاص مانند تنظیم آلارم یا پخش موسیقی تمرکز دارند، Astra به گونهای طراحی شده است که به کاربران در انجام طیف وسیعی از کارها کمک کند.
Astra میتواند به سوالات کاربران به روشی جامع و آموزنده پاسخ دهد، حتی اگر سوالات باز، چالش برانگیز یا عجیب باشند این هوش مصنوعی، وظایف مختلفی مانند رزرو رستوران، تنظیم سفر، ارسال ایمیل و مدیریت لیست کارها را انجام خواهد داد. Astra میتواند به کاربران در نوشتن انواع مختلف محتوای خلاقانه مانند شعر، داستان، فیلمنامه و قطعات موسیقی کمک کند و متن و گفتار را به طور دقیق و روان بین زبانهای مختلف ترجمه کند. در نهایت این هوش مصنوعی به گونهای طراحی شده است که استفاده از آن برای هر کاربری، حتی افراد ناآشنا با هوش مصنوعی، آسان باشد.
هوش مصنوعی Veo؛ ویدیوساز خلاق با دستورات متنی
هوش مصنوعی Veo، یکی از جدیدترین دستاوردهای گوگل در زمینه هوش مصنوعی، در رویداد Google I/O 2024 رونمایی شد. این هوش مصنوعی قدرتمند، به کاربران امکان میدهد تا با استفاده از دستورات متنی ساده، ویدیوهای 1080p با کیفیت بالا و محتوای جذاب خلق کنند.
Imagen 3؛ تصویرساز قدرتمند گوگل
در رویداد هیجانانگیز Google I/O 2024، شاهد رونمایی از هوش مصنوعی تصویرساز جدیدی به نام Imagen 3 از سوی گوگل بودیم. این مدل جدید که به عنوان "قدرتمندترین هوش مصنوعی تصویرساز گوگل" معرفی شده، قابلیتهای چشمگیری در خلق تصاویر با کیفیت بالا و واقعگرایانه از متون و ایدههای ذهنی کاربران ارائه میدهد.
Imagen 3 میتواند تصاویر با وضوح بالا و جزئیات بسیار دقیق تولید و تصاویر را در سبکهای مختلف مانند واقعگرایانه، کارتونی، نقاشی و ... ایجاد کند. این هوش مصنوعی بر اساس خلاقیت شما کار میکند که یعنی میتواند با استفاده از متون و ایدههای ذهنی کاربران، تصاویر خلاقانه و منحصر به فردی تولید کند. تصاویر ایجاد شده توسط این هوش مصنوعی، در فرمتهای مختلف مانند jpg، png و ... ذخیره میشوند.
علاوهبر تمامی این موارد، گوگل از مدل زبانی جدیدی با نام PaliGemma نیز رونمایی کرد. PaliGemma به عنوان "اولین مدل زبانی بصری در خانواده Gemma" معرفی شده و قابلیتهای جذابی را در زمینه کار با تصاویر و ویدیوها ارائه میدهد.
PaliGemma میتواند محتوای تصاویر و ویدیوها را به طور دقیق و جامع شرح دهد و به طور خودکار تصاویر را برچسبگذاری کند و موضوعات موجود در آنها را شناسایی کند. PaliGemma میتواند به سوالات کاربران در مورد تصاویر و ویدیوها به طور دقیق و اطلاعرسانی پاسخ دهد. همچنین میتواند بر اساس تصاویر و ویدیوها، متنهای خلاقانه مانند شعر، داستان و فیلمنامه تولید کند.
رونمایی از تراشه Axion
گوگل در کنار رونمایی از هوش مصنوعیهای چشمگیر در رویداد I/O 2024، از اولین پردازنده اختصاصی خود با معماری Arm به نام Axion نیز پرده برداشت. این تراشه جدید، که برای استفاده در دیتاسنترها طراحی شده، نشاندهنده گامی بزرگ از سوی گوگل در جهت استقلال بیشتر از تراشههای غولهایی مانند اینتل و AMD است.
این تراشه بر پایه معماری Arm Neoverse N2 طراحی شده که به دلیل عملکرد و مصرف انرژی بهینه معروف است. گوگل ادعا میکند که Axion در مقایسه با تراشههای نسل قبلی، عملکرد یادگیری ماشینی را تا 50 درصد و مصرف انرژی را تا 60 درصد کاهش میدهد. Axion به گونهای طراحی شده که قابلیت شخصیسازی بالایی داشته باشد و نیازهای خاص دیتاسنترها را برآورده کند. همچنین گوگل از هوش مصنوعی برای طراحی و بهینهسازی عملکرد Axion استفاده کرده است.
رویداد I/O 2024 گوگل، بار دیگر بر تعهد این شرکت به نوآوری در حوزه هوش مصنوعی تأکید کرد. معرفی مدلهای جدیدی مانند Gemini 1.5 Flash AI، نویدبخش تحولات عظیمی در صنایع مختلف و ارتقای سطح زندگی بشر است.
دیدگاه خود را بنویسید