ورلد لبز، استارتاپی که توسط پیشگام هوش مصنوعی، فی-فی لی، تأسیس شده، اولین محصول تجاری مدلسازی جهان خود را عرضه میکند. Marble اکنون از طریق سطوح رایگان و پولی در دسترس است که به کاربران امکان میدهد دستورات متنی، عکسها، فیلمها، طرحبندیهای سهبعدی یا پانوراما را به محیطهای سهبعدی قابل ویرایش و دانلود تبدیل کنند.
عرضه مدل تولیدی جهان، که اولین بار دو ماه پیش در نسخه بتا محدود منتشر شد، کمی بیش از یک سال پس از خروج ورلد لبز از حالت مخفیانه با ۲۳۰ میلیون دلار بودجه صورت میگیرد و این استارتاپ را از رقبای خود که در حال ساخت مدلهای جهانی هستند، جلوتر میاندازد. مدلهای جهانی سیستمهای هوش مصنوعی هستند که یک نمایش داخلی از یک محیط ایجاد میکنند و میتوانند برای پیشبینی نتایج آینده و برنامهریزی اقدامات مورد استفاده قرار گیرند.
استارتاپهایی مانند Decart و Odyssey نسخههای نمایشی رایگان منتشر کردهاند و Genie گوگل هنوز در پیشنمایش تحقیقاتی محدود قرار دارد. Marble با این موارد – و حتی مدل بیدرنگ خود ورلد لبز، RTFM – متفاوت است، زیرا محیطهای سهبعدی دائمی و قابل دانلود ایجاد میکند، نه اینکه دنیاها را به صورت آنی در حین کاوش تولید کند. به گفته شرکت، این امر منجر به تغییر شکل یا ناسازگاری کمتر میشود و به کاربران امکان میدهد دنیاها را به عنوان Gaussian splats، مش یا فیلم صادر کنند.
Marble همچنین اولین مدل از نوع خود است که ابزارهای ویرایش بومی هوش مصنوعی و یک ویرایشگر سهبعدی ترکیبی را ارائه میدهد که به کاربران امکان میدهد ساختارهای فضایی را قبل از پر کردن جزئیات بصری توسط هوش مصنوعی مسدود کنند.

جاستین جانسون، یکی از بنیانگذاران ورلد لبز، به خبرنگار گفت: «این یک دسته جدید از مدل است که دنیاهای سهبعدی را تولید میکند و این چیزی است که با گذشت زمان بهتر میشود. این چیزی است که ما در حال حاضر خیلی بهبود دادهایم.»
در دسامبر سال گذشته، ورلد لبز نشان داد که چگونه مدلهای اولیه آن میتوانند صحنههای سهبعدی تعاملی را بر اساس یک تصویر واحد تولید کنند. در حالی که چشمگیر بود، صحنههای تا حدودی کارتونی به طور کامل قابل کاوش نبودند، زیرا حرکات به یک منطقه کوچک محدود میشد و خطاهای رندرینگ گاه به گاه وجود داشت.
در آزمایش نسخه بتا، متوجه شدم که Marble دنیاهای چشمگیری را فقط از دستورات تصویری تولید میکند – از محیطهای بازیمانند گرفته تا نسخههای واقعگرایانه از اتاق نشیمن من. صحنهها در لبهها تغییر شکل میدادند، اگرچه ظاهراً این در عرضه امروز بهبود یافته است. با این حال، دنیایی که در نسخه بتا با استفاده از یک دستور واحد تولید کرده بودم، بهتر به نظر میرسید و با هدف من مطابقت بیشتری داشت تا همان دستور اکنون.
من هنوز ویژگیهای ویرایش را آزمایش نکردهام، اگرچه جانسون میگوید آنها Marble را برای پروژههای بازی، VFX و واقعیت مجازی (VR) در کوتاهمدت کاربردی میکنند.
جانسون گفت: «یکی از موضوعات اصلی ما برای Marble در آینده، کنترل خلاقانه است. همیشه باید یک مسیر سریع برای تولید چیزی وجود داشته باشد، اما شما باید بتوانید عمیقتر شیرجه بزنید و کنترل زیادی بر چیزهایی که تولید میکنید، داشته باشید. شما نمیخواهید که دستگاه فقط فرمان را بگیرد و تمام آن خلاقیت را از شما دور کند.»

دیدگاه Marble در مورد کنترل خلاقانه با انعطافپذیری ورودی شروع میشود. نسخه بتا فقط تصاویر تکی را میپذیرفت و مدل را مجبور میکرد تا جزئیات دیدهنشده را برای نمای ۳۶۰ درجه اختراع کند. با عرضه کامل، کاربران اکنون میتوانند چندین تصویر یا کلیپ کوتاه را برای نشان دادن یک فضا از زوایای مختلف آپلود کنند و مدل یک دوقلوی دیجیتالی نسبتاً واقعی تولید کند.
سپس Chisel را داریم، یک ویرایشگر سهبعدی آزمایشی که به کاربران امکان میدهد طرحبندیهای فضایی درشت (مانند دیوارها، جعبهها یا صفحات) را مسدود کنند و سپس دستورات متنی را برای هدایت سبک بصری اضافه کنند. Marble دنیا را تولید میکند و ساختار را از سبک جدا میکند – مشابه اینکه چگونه HTML ساختار یک وبسایت را فراهم میکند و CSS رنگ را اضافه میکند. برخلاف ویرایش مبتنی بر متن، Chisel به شما امکان میدهد مستقیماً اشیاء را دستکاری کنید.

جانسون گفت: «من میتوانم به آنجا بروم و بلوک سهبعدی که نشاندهنده مبل است را بردارم و به جای دیگری منتقل کنم.»
یکی دیگر از ویژگیهای جدید که به شما کنترل ویرایش بیشتری میدهد، امکان گسترش یک دنیا است.
جانسون گفت: «هنگامی که یک دنیا را تولید میکنید، میتوانید آن را تا یک بار گسترش دهید. وقتی به قسمتی از دنیا میروید که شروع به از هم پاشیدن میکند، میتوانید اساساً به مدل بگویید که در آنجا گسترش یابد یا دنیای بیشتری را در مجاورت جایی که در حال حاضر هستید تولید کند، و سپس میتواند جزئیات بیشتری را در آن منطقه اضافه کند.»
کاربرانی که میخواهند فضاهای بسیار بزرگی ایجاد کنند، میتوانند چندین دنیا را با «حالت آهنگساز» ترکیب کنند. جانسون این را با دو دنیایی که قبلاً ساخته بود به من نشان داد – یک اتاق ساخته شده از پنیر با صندلیهای انگور، و دیگری یک اتاق جلسه آیندهنگر در فضا.
مسیر به سوی هوش فضایی

Marble از طریق چهار سطح اشتراک در دسترس است: رایگان (چهار نسل از متن، تصویر یا پانوراما)، استاندارد (20 دلار در ماه، 12 نسل به علاوه ورودی چند تصویری/ویدیویی و ویرایش پیشرفته)، حرفهای (35 دلار در ماه، 25 نسل با گسترش صحنه و حقوق تجاری) و حداکثر (95 دلار در ماه، همه ویژگیها و 75 نسل).
جانسون فکر میکند موارد استفاده اولیه برای Marble بازی، جلوههای بصری برای فیلم و واقعیت مجازی خواهد بود.
توسعهدهندگان بازی احساسات متفاوتی نسبت به این فناوری دارند. یک نظرسنجی اخیر از کنفرانس توسعهدهندگان بازی نشان داد که یک سوم پاسخدهندگان معتقدند هوش مصنوعی مولد تأثیر منفی بر صنعت بازی دارد – 12٪ بیشتر از آنچه نظرسنجی یک سال قبل نشان داد. سرقت مالکیت معنوی، مصرف انرژی و کاهش کیفیت محتوای تولید شده توسط هوش مصنوعی از جمله نگرانیهای اصلی مطرح شده بود. و سال گذشته، یک تحقیق Wired نشان داد که استودیوهای بازی مانند Activision Blizzard از هوش مصنوعی برای کاهش هزینهها و مبارزه با فرسایش استفاده میکنند.
در بازی، جانسون توسعهدهندگانی را میبیند که از Marble برای تولید محیطهای پسزمینه و فضاهای محیطی استفاده میکنند و سپس آن داراییها را به موتورهای بازی مانند Unity یا Unreal Engine وارد میکنند تا عناصر تعاملی، منطق و کد را اضافه کنند.
او گفت: «این برای جایگزینی کل خط لوله موجود برای بازی طراحی نشده است، بلکه فقط برای ارائه داراییهایی است که میتوانید در آن خط لوله قرار دهید.»
به گفته جانسون، برای کار VFX، Marble از ناسازگاری و کنترل ضعیف دوربین که ژنراتورهای ویدیویی هوش مصنوعی را آزار میدهد، جلوگیری میکند. او گفت که داراییهای سهبعدی آن به هنرمندان اجازه میدهد صحنهها را مرحلهبندی کنند و حرکات دوربین را با دقت کامل فریم کنترل کنند.
در حالی که جانسون گفت World Labs در حال حاضر بر برنامههای واقعیت مجازی (VR) تمرکز نمیکند، او خاطرنشان کرد که این صنعت «تشنه محتوا» است و از این عرضه هیجانزده است. Marble در حال حاضر با هدستهای Vision Pro و Quest 3 VR سازگار است و هر دنیای تولید شده را میتوان امروز در VR مشاهده کرد.
Marble همچنین ممکن است موارد استفاده بالقوهای برای رباتیک داشته باشد. جانسون خاطرنشان کرد که برخلاف تولید تصویر و ویدیو، رباتیک از مزیت یک مخزن بزرگ دادههای آموزشی برخوردار نیست. اما با ژنراتورهایی مانند Marble، شبیهسازی محیطهای آموزشی آسانتر میشود.
بر اساس مانیفست اخیری از فی-فی لی، مدیرعامل و یکی از بنیانگذاران World Labs، Marble اولین قدم به سوی ایجاد «یک مدل جهانی واقعاً هوشمند فضایی» است.
لی معتقد است که «نسل بعدی مدلهای جهانی به ماشینها این امکان را میدهد که به هوش فضایی در سطحی کاملاً جدید دست یابند.» اگر مدلهای زبان بزرگ بتوانند به ماشینها خواندن و نوشتن را بیاموزند، لی امیدوار است که سیستمهایی مانند Marble بتوانند به آنها دیدن و ساختن را بیاموزند. او میگوید توانایی درک چگونگی وجود و تعامل اشیا در فضاهای سهبعدی میتواند در نهایت به ماشینها کمک کند تا پیشرفتهایی فراتر از بازی و رباتیک، و حتی در علم و پزشکی داشته باشند.
لی نوشت: «رویاهای ما در مورد ماشینهای واقعاً هوشمند بدون هوش فضایی کامل نخواهد شد.»
نکته حساس یا اسناد محرمانه دارید؟ ما در حال گزارش در مورد عملکرد داخلی صنعت هوش مصنوعی هستیم – از شرکتهایی که آینده آن را شکل میدهند تا افرادی که تحت تأثیر تصمیمات آنها قرار میگیرند. با ربکا بلان در rebecca.bellan@techcrunch.com یا راسل براندوم در russell.brandom@techcrunch.com تماس بگیرید. برای ارتباط امن، میتوانید از طریق سیگنال با @rebeccabellan.491 و russellbrandom.49 با آنها تماس بگیرید.








