رونمایی گوگل از قدرتمندترین مدل هوش مصنوعی

شرکت گوگل به تازگی از قدرتمندترین مدل هوش مصنوعی خود به نام «جمنای»‌(Gemini) رونمایی کرده است.

به گزارش اکونگار به نقل از ایسنا؛ جمنای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که می‌تواند نه تنها متن، بلکه تصاویر، ویدئوها و صداها را نیز درک کند. به عنوان یک مدل چندوجهی، جمنای قادر به انجام وظایف پیچیده‌ای در حوزه ریاضیات، فیزیک و سایر زمینه‌ها و همچنین درک و تولید کد با کیفیت بالا در زبان‌های برنامه‌نویسی مختلف است.

در حال حاضر این هوش مصنوعی در هوش مصنوعی گوگل بارد (Google Bard) و تلفن همراه هوشمند گوگل پیکسل (Google Pixel‌۸) ادغام شده است، اما به تدریج در سایر سرویس‌های گوگل نیز قرار خواهد گرفت. به گفته دنیس حسابیس (Dennis Hassabis)، مدیرعامل و یکی از بنیان‌گذاران گوگل دیپ‌مایند، جمنای نتیجه تلاش‌های مشترک در مقیاس بزرگ توسط تیم‌های سراسر گوگل، از جمله همکاران ما در بخش پژوهش گوگل (Google Research) است.

این هوش مصنوعی از ابتدا با هدف چندوجهی بودن ساخته شده و این بدان معناست که می‌تواند موارد مختلف را به هم تعمیم دهد و به‌طور یکپارچه درک کند، کار کند و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.

گوگل، جمنای را به عنوان یک مدل انعطاف‌پذیر توصیف می‌کند که می‌تواند روی همه‌چیز از مراکز داده گوگل گرفته تا دستگاه‌های تلفن همراه اجرا شود. برای دستیابی به این انعطاف‌پذیری، جمنای در سه نسخه عرضه می‌شود: ‌نانوجمنای (Gemini Nano)، پروجمنای (Gemini Pro) و اولترا جمنای (Gemini Ultra)‌.

اندازه مدل نانو جمنای برای اجرا روی تلفن‌های همراه هوشمند، به‌ویژه گوگل پیکسل ۸ (Google Pixel۸) طراحی شده است. این مدل برای انجام کارها روی دستگاهی که نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرورهای خارجی دارد، مانند ارائه پیشنهاد برای پاسخ‌ در برنامه‌های چت یا خلاصه کردن متن ساخته شده است.

پرو جمنای که در مراکز داده گوگل اجرا می‌شود، برای تامین آخرین نسخه چت‌بات هوش مصنوعی این شرکت یعنی بارد (Bard) طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است. اگرچه اولترا جمنای هنوز برای استفاده گسترده در دسترس نیست، اما گوگل آن را به عنوان تواناترین مدل خود توصیف می‌کند که از نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات و توسعه مدل‌های زبانی بزرگ (LLM) فراتر رفته است.

این هوش مصنوعی برای کارهای بسیار پیچیده طراحی شده و قرار است پس از اتمام مرحله آزمایشی فعلی عرضه شود. به نظر می‌رسد مدل جدید جمنای گوگل یکی از بزرگ‌ترین و پیشرفته‌ترین مدل‌های هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل اولترا حقیقت را مشخص خواهد کرد. در مقایسه با سایر مدل‌های محبوبی که در حال حاضر چت‌بات‌های هوش مصنوعی را تقویت می‌کنند، جمنای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدل‌های دیگر، مانند جی‌پی‌تی-۴، برای چندوجهی بودن واقعا به اتصالات و ادغام‌ها متکی هستند.

در مقایسه با جی‌پی‌تی-۴ که یک مدل عمدتا مبتنی بر متن است، جمنای به راحتی وظایف چندوجهی را به صورت بومی انجام می‌دهد. در حالی که جی‌پی‌تی‌-۴ در کارهای مرتبط با زبان مانند ایجاد محتوا و تجزیه و تحلیل متن پیچیده به صورت بومی برتر است، برای انجام تجزیه و تحلیل تصویر و دسترسی به وب به اتصالات اوپن‌ای‌آی (OpenAI) متوسل می‌شود و برای تولید تصاویر و پردازش صدا به DALL-E۳ و ویسپر (Whisper) متکی است.

همچنین به نظر می‌رسد جمنای گوگل بیشتر از سایر مدل‌های موجود در حال حاضر روی محصول متمرکز باشد. این هوش مصنوعی یا در اکوسیستم شرکت ادغام شده یا برنامه‌ این کار را دارد، زیرا به هر دو دستگاه بارد و پیکسل ۸ قدرت می‌بخشد. مدل‌های دیگر، مانند جی‌پی‌تی-۴ و Meta&#۳۹;s Llama، بیشتر سرویس‌گرا هستند و برای برنامه‌ها، ابزارها و خدمات توسعه‌دهندگان مختلف شخص ثالث در دسترس قرار دارند.

بیشتر بخوانید

۱۹ آذر ۱۴۰۲

کپی شد