نمای کلی ویدیویی که در Google I/O آمده است؟

[ad_1] Google I/O 2025 از روز سه شنبه شروع می شود و ما انتظار داریم که اصلی اصلی آن را کاملاً روی اعلامیه های هوش مصنوعی متمرکز کند. هفته گذشته ، Google از ارتقاء برتر Android 16 ، از جمله طراحی جدید ، امنیت بهتر و جمینی جایگزین دستیار Google در هر دستگاه هوشمند رونمایی
[ad_1]
Google I/O 2025 از روز سه شنبه شروع می شود و ما انتظار داریم که اصلی اصلی آن را کاملاً روی اعلامیه های هوش مصنوعی متمرکز کند. هفته گذشته ، Google از ارتقاء برتر Android 16 ، از جمله طراحی جدید ، امنیت بهتر و جمینی جایگزین دستیار Google در هر دستگاه هوشمند رونمایی کرد.
Google I/O نیز ممکن است در این مرحله Gemini I/O نامیده شود. هوش مصنوعی از زمان ورود Chatgpt بزرگترین اولویت آن بوده است و گوگل طی چند سال گذشته پیشرفت چشمگیری در این زمینه داشته است. جدیدترین مدل های جمینی موفقیت آمیز بوده است ، با این که گوگل به طور مداوم عملکرد آنها را به خود اختصاص داده و ویژگی های جدیدی را اضافه می کند.
به عنوان مثال ، Google به تازگی Gemini 2.5 Pro را برای بهبود توانایی های برنامه نویسی خود به روز کرده است. همچنین تولید تصویر و ویرایش پشتیبانی را برای کاربران جمینی به ارمغان آورد. Google همچنین شامل مروری های صوتی در Gemini Experience ، یک ویژگی قبلاً فقط NotebookLM است که به شما امکان می دهد گزارش های تحقیق را به پادکست های تعاملی تبدیل کنید.
من بیش از یک بار گفتم که من دوست دارم چتپت را برای تهیه گزارش های تحقیقاتی عمیق از مدل های OpenAi آسانتر کند. من نمی دانم که آیا به زودی شاهد چنین ارتقاء از Openai خواهیم بود ، اما جمینی ممکن است چیزی بهتر از این را بدست آورد ، و این ویژگی پیش از یک I/O 2025 فاش شده است.
من از زمان انتشار چند ماه پیش اغلب از ویژگی تحقیقات عمیق Chatgpt استفاده کرده ام. اما من دوست دارم یک روش آسان برای گوش دادن به گزارش ها در حالی که اجرا می کنم ، به خصوص مواردی که لازم نیست بلافاصله بخوانم. این همان چیزی است که نمای کلی صوتی به کاربران جمینی ارائه می دهد.
من همچنین اغلب تعجب کرده ام که چه زمانی می توانم به Chatgpt بگویم تا فیلم هایی را که مفاهیم خاصی را توضیح می دهد ، بسازد. من از هوش مصنوعی می خواهم که برای ایده های خاص به من بازنمودهای گرافیکی بدهد یا برای دیگران نمودارهایی ایجاد کند. اما این در مورد آن است. چه می شود اگر هوش مصنوعی بتواند آموزش های ویدیویی/خلاصه ای را در محل ایجاد کند؟
به نظر می رسد که Google ممکن است روی آن نوع عملکردی کار کند ، که ممکن است در آینده به عنوان یک ویژگی نمای کلی ویدیویی برای کاربران Gemini در دسترس باشد.
هیچ تأیید شده است ، و رویداد I/O Google این سه شنبه آغاز می شود ، اما کماندار داشتن شواهدی پیدا کرد که نشان می دهد چنین محصول همه در یک به زودی به Gemini می آید.
این وبلاگ به Illuminate ، یک آزمایش Google AI پرداخت که به شما امکان می دهد محتوا را به بحث های صوتی تولید شده AI تبدیل کنید. این به نظر می رسد مانند فناوری Notebooklm در بازی ، اما این یک محصول متفاوت است. کماندار می گوید نسخه جدید Illuminate از بین رفته است ، و بسته بندی ویژگی هایی که از اکثر آزمایش کنندگان پنهان است.
این وبلاگ می گوید که Illuminate ممکن است به کاربران اجازه دهد تا برای انواع مطالب ، نه فقط مقالات تحقیق ، نمای کلی صوتی را ایجاد کنند. کتابهای کلاسیک مانند آلیس در سرزمین عجایب وت گتسبی عالی همچنین ممکن است پشتیبانی شود.
UI جدید دارای کنترل های آزمایشی مانند دکمه ویرایش ، ضامن های زیرنویس و یک ابزار تولید تصویر جلد است.
با این حال ، جالب ترین ویژگی Illuminate جدید بخشی به نام Sparks است که در پیش نمایش اولیه با توضیحات زیر قرار دارد:
تصور کنید که هر سؤالی می تواند فوراً به یک فیلم کوتاه ، ۱۰۰ ٪ AI تولید شود.
اکنون ، این دلیلی برای هیجان از یک ویژگی نمای کلی ویدیویی در آینده نزدیک به Gemini است. کماندار چندین نمونه را در X به اشتراک گذاشت که نشان می دهد چگونه این ویژگی کار می کند. شما به هوش مصنوعی سؤال می کنید ، و Illuminate یک فیلم کامل با تفسیر صوتی ایجاد می کند که به فوریت می پردازد.
این کلیپ ها بین یک تا سه دقیقه طول دارند ، بنابراین به سختی می توانند گزارش تحقیقاتی عمیق چتپپ را پوشش دهند. با این حال ، آنها برای توضیح انواع مفاهیم با کمک نشانه های بصری کامل خواهند بود. این امر درک موضوعات خاص را حتی ساده تر می کند ، در حالی که دیگران ممکن است برای مخاطبان خاصی سرگرم کننده تر باشند.
هنوز مشخص نیست که AI پروژه آزمایشی از چه مدل هایی استفاده می کند. این وبلاگ حدس می زند که ، به دلیل کیفیت بالای فیلم هایی که می تواند منتشر کند ، ممکن است یک ابزار تولید ویدیویی مانند VEO 3 را به نسخه بعدی چند بعدی Gemini ، یک ابزار Gmini Ultra که Google همیشه می تواند در I/O 2025 رونمایی کند ، متصل کند.
همچنین ، این فیلم ها تجربه پادکست مانند را در جای خود قرار می دهند ، و میزبان های تولید شده توسط AI در مورد موضوع بحث می کنند. بنابراین ، ویژگی Sparks همیشه می تواند به نوعی از ویژگی های کلی ویدیو در بین محصولات با قدرت جمینی تبدیل شود.
به همان اندازه هیجان انگیز است ، همه ما باید به یاد داشته باشیم که فناوری هوش مصنوعی ارزان نیست ، به خصوص نوعی که به شما امکان می دهد فیلم ها را از ابتدا تولید کنید. هرچه کلیپ با کیفیت طولانی تر و بالاتر باشد ، ممکن است گران تر باشد. من انتظار ندارم که بررسی های کلی ویدیویی به زودی به اندازه مرور کلی صوتی در دسترس باشد. همچنین ، شما ممکن است مجبور شوید از طریق اشتراک جمینی هزینه آن را بپردازید.
اما توانایی گفتن به هوش مصنوعی برای نشان دادن یک مفهوم ، یک قطعه تحقیق یا یک کتاب به صورت ویدیویی قطعاً هیجان انگیز است. چنین فناوری باید در آینده بهتر و گسترده تر شود ، و من نمی توانم منتظر بمانم تا Openai ابزاری مشابه برای چتگپ به ارمغان بیاورد.
در حالی که ما منتظر اعلامیه های بزرگ AI Google در I/O 2025 هستیم ، می توانید نمونه های جرقه های بیشتری را در این لینک بررسی کنید.
[ad_2]
لینک منبع
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰