ورلد لبز، استارتاپی که توسط پیشگام هوش مصنوعی، فی-فی لی، تأسیس شده، اولین محصول تجاری مدل‌سازی جهان خود را عرضه می‌کند. Marble اکنون از طریق سطوح رایگان و پولی در دسترس است که به کاربران امکان می‌دهد دستورات متنی، عکس‌ها، فیلم‌ها، طرح‌بندی‌های سه‌بعدی یا پانوراما را به محیط‌های سه‌بعدی قابل ویرایش و دانلود تبدیل کنند.

عرضه مدل تولیدی جهان، که اولین بار دو ماه پیش در نسخه بتا محدود منتشر شد، کمی بیش از یک سال پس از خروج ورلد لبز از حالت مخفیانه با ۲۳۰ میلیون دلار بودجه صورت می‌گیرد و این استارتاپ را از رقبای خود که در حال ساخت مدل‌های جهانی هستند، جلوتر می‌اندازد. مدل‌های جهانی سیستم‌های هوش مصنوعی هستند که یک نمایش داخلی از یک محیط ایجاد می‌کنند و می‌توانند برای پیش‌بینی نتایج آینده و برنامه‌ریزی اقدامات مورد استفاده قرار گیرند.

استارتاپ‌هایی مانند Decart و Odyssey نسخه‌های نمایشی رایگان منتشر کرده‌اند و Genie گوگل هنوز در پیش‌نمایش تحقیقاتی محدود قرار دارد. Marble با این موارد – و حتی مدل بی‌درنگ خود ورلد لبز، RTFM – متفاوت است، زیرا محیط‌های سه‌بعدی دائمی و قابل دانلود ایجاد می‌کند، نه اینکه دنیاها را به صورت آنی در حین کاوش تولید کند. به گفته شرکت، این امر منجر به تغییر شکل یا ناسازگاری کمتر می‌شود و به کاربران امکان می‌دهد دنیاها را به عنوان Gaussian splats، مش یا فیلم صادر کنند.

Marble همچنین اولین مدل از نوع خود است که ابزارهای ویرایش بومی هوش مصنوعی و یک ویرایشگر سه‌بعدی ترکیبی را ارائه می‌دهد که به کاربران امکان می‌دهد ساختارهای فضایی را قبل از پر کردن جزئیات بصری توسط هوش مصنوعی مسدود کنند.  

Image Credits:World Labs

جاستین جانسون، یکی از بنیانگذاران ورلد لبز، به خبرنگار گفت: «این یک دسته جدید از مدل است که دنیاهای سه‌بعدی را تولید می‌کند و این چیزی است که با گذشت زمان بهتر می‌شود. این چیزی است که ما در حال حاضر خیلی بهبود داده‌ایم.» 

در دسامبر سال گذشته، ورلد لبز نشان داد که چگونه مدل‌های اولیه آن می‌توانند صحنه‌های سه‌بعدی تعاملی را بر اساس یک تصویر واحد تولید کنند. در حالی که چشمگیر بود، صحنه‌های تا حدودی کارتونی به طور کامل قابل کاوش نبودند، زیرا حرکات به یک منطقه کوچک محدود می‌شد و خطاهای رندرینگ گاه به گاه وجود داشت. 

در آزمایش نسخه بتا، متوجه شدم که Marble دنیاهای چشمگیری را فقط از دستورات تصویری تولید می‌کند – از محیط‌های بازی‌مانند گرفته تا نسخه‌های واقع‌گرایانه از اتاق نشیمن من. صحنه‌ها در لبه‌ها تغییر شکل می‌دادند، اگرچه ظاهراً این در عرضه امروز بهبود یافته است. با این حال، دنیایی که در نسخه بتا با استفاده از یک دستور واحد تولید کرده بودم، بهتر به نظر می‌رسید و با هدف من مطابقت بیشتری داشت تا همان دستور اکنون. 

من هنوز ویژگی‌های ویرایش را آزمایش نکرده‌ام، اگرچه جانسون می‌گوید آنها Marble را برای پروژه‌های بازی، VFX و واقعیت مجازی (VR) در کوتاه‌مدت کاربردی می‌کنند. 

جانسون گفت: «یکی از موضوعات اصلی ما برای Marble در آینده، کنترل خلاقانه است. همیشه باید یک مسیر سریع برای تولید چیزی وجود داشته باشد، اما شما باید بتوانید عمیق‌تر شیرجه بزنید و کنترل زیادی بر چیزهایی که تولید می‌کنید، داشته باشید. شما نمی‌خواهید که دستگاه فقط فرمان را بگیرد و تمام آن خلاقیت را از شما دور کند.» 

Marble’s input to output pipeline.Image Credits:World Labs

دیدگاه Marble در مورد کنترل خلاقانه با انعطاف‌پذیری ورودی شروع می‌شود. نسخه بتا فقط تصاویر تکی را می‌پذیرفت و مدل را مجبور می‌کرد تا جزئیات دیده‌نشده را برای نمای ۳۶۰ درجه اختراع کند. با عرضه کامل، کاربران اکنون می‌توانند چندین تصویر یا کلیپ کوتاه را برای نشان دادن یک فضا از زوایای مختلف آپلود کنند و مدل یک دوقلوی دیجیتالی نسبتاً واقعی تولید کند. 

سپس Chisel را داریم، یک ویرایشگر سه‌بعدی آزمایشی که به کاربران امکان می‌دهد طرح‌بندی‌های فضایی درشت (مانند دیوارها، جعبه‌ها یا صفحات) را مسدود کنند و سپس دستورات متنی را برای هدایت سبک بصری اضافه کنند. Marble دنیا را تولید می‌کند و ساختار را از سبک جدا می‌کند – مشابه اینکه چگونه HTML ساختار یک وب‌سایت را فراهم می‌کند و CSS رنگ را اضافه می‌کند. برخلاف ویرایش مبتنی بر متن، Chisel به شما امکان می‌دهد مستقیماً اشیاء را دستکاری کنید.  

Marble’s Chisel feature decouples structure from style. Image Credits:World Labs

جانسون گفت: «من می‌توانم به آنجا بروم و بلوک سه‌بعدی که نشان‌دهنده مبل است را بردارم و به جای دیگری منتقل کنم.» 

یکی دیگر از ویژگی‌های جدید که به شما کنترل ویرایش بیشتری می‌دهد، امکان گسترش یک دنیا است.  

جانسون گفت: «هنگامی که یک دنیا را تولید می‌کنید، می‌توانید آن را تا یک بار گسترش دهید. وقتی به قسمتی از دنیا می‌روید که شروع به از هم پاشیدن می‌کند، می‌توانید اساساً به مدل بگویید که در آنجا گسترش یابد یا دنیای بیشتری را در مجاورت جایی که در حال حاضر هستید تولید کند، و سپس می‌تواند جزئیات بیشتری را در آن منطقه اضافه کند.»

کاربرانی که می‌خواهند فضاهای بسیار بزرگی ایجاد کنند، می‌توانند چندین دنیا را با «حالت آهنگساز» ترکیب کنند. جانسون این را با دو دنیایی که قبلاً ساخته بود به من نشان داد – یک اتاق ساخته شده از پنیر با صندلی‌های انگور، و دیگری یک اتاق جلسه آینده‌نگر در فضا.

مسیر به سوی هوش فضایی

Space ship environment created in Marble with text prompt overlayed. Note how the lights are realistically reflected in the hub’s walls.Image Credits:World Labs/TechCrunch

Marble از طریق چهار سطح اشتراک در دسترس است: رایگان (چهار نسل از متن، تصویر یا پانوراما)، استاندارد (20 دلار در ماه، 12 نسل به علاوه ورودی چند تصویری/ویدیویی و ویرایش پیشرفته)، حرفه‌ای (35 دلار در ماه، 25 نسل با گسترش صحنه و حقوق تجاری) و حداکثر (95 دلار در ماه، همه ویژگی‌ها و 75 نسل). 

جانسون فکر می‌کند موارد استفاده اولیه برای Marble بازی، جلوه‌های بصری برای فیلم و واقعیت مجازی خواهد بود.  

توسعه‌دهندگان بازی احساسات متفاوتی نسبت به این فناوری دارند. یک نظرسنجی اخیر از کنفرانس توسعه‌دهندگان بازی نشان داد که یک سوم پاسخ‌دهندگان معتقدند هوش مصنوعی مولد تأثیر منفی بر صنعت بازی دارد – 12٪ بیشتر از آنچه نظرسنجی یک سال قبل نشان داد. سرقت مالکیت معنوی، مصرف انرژی و کاهش کیفیت محتوای تولید شده توسط هوش مصنوعی از جمله نگرانی‌های اصلی مطرح شده بود. و سال گذشته، یک تحقیق Wired نشان داد که استودیوهای بازی مانند Activision Blizzard از هوش مصنوعی برای کاهش هزینه‌ها و مبارزه با فرسایش استفاده می‌کنند. 

در بازی، جانسون توسعه‌دهندگانی را می‌بیند که از Marble برای تولید محیط‌های پس‌زمینه و فضاهای محیطی استفاده می‌کنند و سپس آن دارایی‌ها را به موتورهای بازی مانند Unity یا Unreal Engine وارد می‌کنند تا عناصر تعاملی، منطق و کد را اضافه کنند. 

او گفت: «این برای جایگزینی کل خط لوله موجود برای بازی طراحی نشده است، بلکه فقط برای ارائه دارایی‌هایی است که می‌توانید در آن خط لوله قرار دهید.»  

به گفته جانسون، برای کار VFX، Marble از ناسازگاری و کنترل ضعیف دوربین که ژنراتورهای ویدیویی هوش مصنوعی را آزار می‌دهد، جلوگیری می‌کند. او گفت که دارایی‌های سه‌بعدی آن به هنرمندان اجازه می‌دهد صحنه‌ها را مرحله‌بندی کنند و حرکات دوربین را با دقت کامل فریم کنترل کنند. 

در حالی که جانسون گفت World Labs در حال حاضر بر برنامه‌های واقعیت مجازی (VR) تمرکز نمی‌کند، او خاطرنشان کرد که این صنعت «تشنه محتوا» است و از این عرضه هیجان‌زده است. Marble در حال حاضر با هدست‌های Vision Pro و Quest 3 VR سازگار است و هر دنیای تولید شده را می‌توان امروز در VR مشاهده کرد.

Marble همچنین ممکن است موارد استفاده بالقوه‌ای برای رباتیک داشته باشد. جانسون خاطرنشان کرد که برخلاف تولید تصویر و ویدیو، رباتیک از مزیت یک مخزن بزرگ داده‌های آموزشی برخوردار نیست. اما با ژنراتورهایی مانند Marble، شبیه‌سازی محیط‌های آموزشی آسان‌تر می‌شود.  

بر اساس مانیفست اخیری از فی-فی لی، مدیرعامل و یکی از بنیانگذاران World Labs، Marble اولین قدم به سوی ایجاد «یک مدل جهانی واقعاً هوشمند فضایی» است. 

لی معتقد است که «نسل بعدی مدل‌های جهانی به ماشین‌ها این امکان را می‌دهد که به هوش فضایی در سطحی کاملاً جدید دست یابند.» اگر مدل‌های زبان بزرگ بتوانند به ماشین‌ها خواندن و نوشتن را بیاموزند، لی امیدوار است که سیستم‌هایی مانند Marble بتوانند به آنها دیدن و ساختن را بیاموزند. او می‌گوید توانایی درک چگونگی وجود و تعامل اشیا در فضاهای سه‌بعدی می‌تواند در نهایت به ماشین‌ها کمک کند تا پیشرفت‌هایی فراتر از بازی و رباتیک، و حتی در علم و پزشکی داشته باشند. 

لی نوشت: «رویاهای ما در مورد ماشین‌های واقعاً هوشمند بدون هوش فضایی کامل نخواهد شد.»

نکته حساس یا اسناد محرمانه دارید؟ ما در حال گزارش در مورد عملکرد داخلی صنعت هوش مصنوعی هستیم – از شرکت‌هایی که آینده آن را شکل می‌دهند تا افرادی که تحت تأثیر تصمیمات آنها قرار می‌گیرند. با ربکا بلان در rebecca.bellan@techcrunch.com یا راسل براندوم در russell.brandom@techcrunch.com تماس بگیرید. برای ارتباط امن، می‌توانید از طریق سیگنال با @rebeccabellan.491 و russellbrandom.49 با آنها تماس بگیرید.

اشتراک‌ها:
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *