طی برگزاری دو کنفرانس سالانه «بیلد» مایکروسافت و «گوگل I/O»
غول ها چند فناوری نو رو کردند
آرزوکیهان
خبرنگار
این روزها غولهای فناوری جهان همچون مایکروسافت و گوگل خبرساز شدهاند و در قالب رویدادهای سالانه، با معرفی محصولات فناورانه جدید خود، کاربران را شگفتزده میکنند. یکی از این رویدادها، کنفرانس دوروزه گوگل باعنوان Google I/O 2025 است که روز گذشته به کار خود پایان داد.
یک جستوجوی هوشمند
در رویداد امسال گوگل، این غول دنیای فناوری با انبوهی از تازهترین دستاوردهای خود که البته حضور فناوری هوش مصنوعی در آنها بسیار پررنگ بود، مایه شگفتی مخاطبان شد. «ساندار پیچای»، مدیرعامل گوگل در این مراسم از پیشرفتهای گوگل در زمینه توسعه هوش مصنوعی، ارتباطات ویدیویی و تجربههای دیجیتال شخصی شده رونمایی کرد و یادآورشد:« این پیشرفتها نحوه دسترسی مردم به اطلاعات را متحول کرده و میتواند در کاهش ترافیک اینترنت تأثیرگذار باشد.»
با راهاندازی حالت هوش مصنوعی (AI Mode)برای موتور جستوجوی گوگل، حالا دیگر کاربران میتوانند سؤالات طولانی بپرسند و بهترین پاسخ را در سریعترین زمان ممکن دریافت کنند. این قابلیت جدید، روش تعامل کاربران با جستوجوی گوگل را متحول میکند و از جستوجوهای سنتی با کلمات کلیدی، به مکالمات روان و شبیه به کارشناسان تبدیل میشود.
ورود هوش مصنوعی به دنیای فیلم و موسیقی
امسال گوگل در حوزه موسیقی و فیلم هم دستاوردهایی داشت و با رونمایی از نسخه هوش مصنوعی veo 3، حالا دیگر کاربران میتوانند با دستور متنی، ویدیوهایی با رزولوشن 1080p بسازند. این اولین نسخه این مدل است که میتواند ویدیوهایی با صدا تولید کند.
امسال همچنین همکاری نوازندگان و تولیدکنندگان موسیقی، ابزار هوش مصنوعی Lyria 2 گوگل برای تولید موسیقی معرفی شد. به این ترتیب کاربران میتوانند با پرامپتهای(دستورهای) متنی، برای تولید موسیقی استفاده کنند و درنهایت، خروجی نهایی یعنی یک قطعه موسیقی در اختیار داشته باشند. به گفته مدیران گوگل، موسیقیدانان و نوازندگان میتوانند با استفاده از Lyria 2 قطعات موسیقی را در شیوهها و سبکهای بیشماری خلق کنند.
همچنین در این رویداد، گوگل از ابزار هوش مصنوعی Flow برای تولید فیلم رونمایی کرد و کاربران میتوانند با پرامپتهای متنی یا با عکسهای خود ویدیو بسازند. ابزار ویرایش سینمایی جدید Flow، کلیپهای کوتاه را به صحنههای کامل تبدیل میکند و مسیرهای خلاقانه جدیدی برای فیلمسازان و سازندگان محتوا باز میکند. البته کلیپها 8 ثانیهای هستند ولی میتوان از Flow برای چسباندن چندین کلیپ بههم استفاده کرد. این ابزار میتواند بهطور همزمان با سایر مدلهای هوش مصنوعی این شرکت یعنی جمینای، Veo و Imagen کار کند.
از عینک هوشمند مترجم تا پرو مجازی لباس
امسال گوگل در عرصه ترجمه گامهای بزرگی برداشته است. یکی از جذابترین محصولات جدید گوگل، عینک هوشمند این غول فناوری است که مجهز به نرمافزار اندروید XR جدید این کمپانی است. یکی از قابلیتهای این عینک که قابلیت تایپ و ترجمه همزمان را دارد، توسط شهرام ایزدی، معاون رئیس و مدیر کل XR گوگل رونمایی شد. وی نشان داد که حالا دیگر این عینک قابلیت ترجمه زبان فارسی به انگلیسی را نیز دارد. این عینک، دوربینهای داخلی، میکروفن و بلندگو دارند و با تلفن کاربر کار میکنند تا بدون نیاز به بیرون آوردن گوشی از کیف، زمینه دسترسی به برنامهها را فراهم کنند. گوگل همچنین در این رویداد از سرویس مترجم همزمان در Google Meet و همچنین سرویس Google Beam برای تماس تصویری سه بعدی رونمایی کرد.
از دیگر محصولات جالبی که در این رویداد توسط گوگل ارائه شد، امکان «پرو کردن مجازی لباس» با عکس شخصی است. این قابلیت جدید تجربه جدیدی برای خرید آنلاین رقم میزند و کاربران میتوانند لباسها را بهصورت مجازی و با استفاده از عکس خود امتحان کنند. با فعالسازی این قابلیت، کاربران در نتایج جستوجوی گوگل و کنار گزینههایی مانند شلوار، پیراهن، پیراهنهای بلند و دامن، دکمهای با عنوان «Try it on» را مشاهده میکنند. سپس گوگل از آنها میخواهد یک عکس تمامقد را بارگذاری کنند تا با استفاده از هوش مصنوعی، تصویری از کاربر با لباس انتخابی وی، تولید شود. این تصویر را میتوان دانلود کرد یا با دیگران به اشتراک گذاشت.
تازههای مایکروسافت در یک کنفرانس
امسال برگزاری کنفرانس سالانه توسعهدهندگان مایکروسافت هم که هرساله توسعهدهندگان و متخصصان فناوری اطلاعات را هدف قرار میدهد، با کنفرانس گوگل همزمان شده است. «مایکروسافت بیلد2025»از 19 مه در سیاتل آمریکا آغاز شده و امروز 22 مه (اول خرداد) به کار خود پایان میدهد. در این رویداد هم جدیدترین قابلیتهای ویندوز، آفیس و سایر محصولات این کمپانی به نمایش گذاشته شد. امسال تمرکز عمده کنفرانس مایکروسافت بر هوش مصنوعی و عرضه ایجنتهای هوش مصنوعی(agent) بود. این ایجنتها میتوانند بهجای ما فکر کنند، تصمیم بگیرند و کار انجام دهند.
هر چند پیش از این گفته میشد مایکروسافت پشتیبانی بالایی از اوپن ای آی دارد اما مایکروسافت به دنبال ارائه مدلهای هوش مصنوعی شرکتهای رقیب از جمله xAI، متا، و استارتاپهای اروپایی از طریق دیتاسنترهای خود به مشتریان خدمات ابری Azure بود تا با حفظ بیطرفی در رقابت جهانی هوش مصنوعی، تنوع مدلهای ارائهشده را افزایش دهد. به این ترتیب حالا دیگر کاربران Azure مایکروسافت میتوانند از بیش از ۱۹۰۰ مدل مختلف ازجمله Grok و مدلهای Llama از شرکت متا بهره بگیرند.
همچنین در این رویداد، مایکروسافت نسخه جدید GitHub Copilot را معرفی کرده که میتواند در نوشتن، بررسی و اصلاح کد، به توسعهدهندگان نرمافزار کمک شایان توجهی کند.
مایکروسافت همچنین با معرفی فناوری جدیدی به نام NLWeb میخواهد تجربه وبگردی را متحول کند. کاربران از این پس بهجای اینکه دنبال دکمهها یا منوها بگردند، میتوانند مستقیماً سؤال خود را از سایت بپرسند و پاسخ را در قالبی شبیه مکالمه دریافت کنند. این فناوری میتواند دستیارهای هوش مصنوعی را به محتوای سایتها متصل کند و تعاملی طبیعیتر بین انسان و وب به وجود آورد.
در این کنفرانس همچنین اپلیکیشن جدید Microsoft 365 Copilot با یک رابط کاربری بازطراحیشده رونمایی شد که یکی از مهمترین ویژگیهای این نسخه، قابلیت تولید تصویر با مدل GPT-40 است. این ابزار میتواند تصاویر دقیقتر و واقعیتری نسبت به نسلهای قبلی تولید کند و حتی نسخههای بهبودیافتهای از تصاویر پیشین بسازد.