رشد انفجاری شرکتهای هوش مصنوعی، تقاضا برای قدرت پردازشی را به اوج رسانده است. شرکتهایی مانند CoreWeave، Together AI و Lambda Labs از این تقاضا بهرهبرداری کردهاند و به دلیل تواناییشان در ارائه ظرفیت محاسباتی توزیعشده، توجه و سرمایه زیادی را به خود جلب کردهاند.
اما بیشتر شرکتها همچنان دادههای خود را در سه ارائهدهنده بزرگ خدمات ابری، یعنی AWS، Google Cloud و Microsoft Azure ذخیره میکنند. سیستمهای ذخیرهسازی این شرکتها طوری طراحی شدهاند که دادهها را نزدیک به منابع محاسباتی خود نگه دارند، نه اینکه آنها را در چندین ابر یا منطقه پخش کنند.
اویس طارق، یکی از بنیانگذاران و مدیرعامل Tigris Data، به خبرنگار گفت: «حجمهای کاری مدرن هوش مصنوعی و زیرساخت هوش مصنوعی، محاسبات توزیعشده را به جای ابرهای بزرگ انتخاب میکنند. ما میخواهیم همین گزینه را برای ذخیرهسازی هم فراهم کنیم، زیرا بدون ذخیرهسازی، محاسبات هیچ ارزشی ندارد.»
شرکت Tigris که توسط تیمی که پلتفرم ذخیرهسازی Uber را توسعه دادهاند، تاسیس شده است، در حال ساخت شبکهای از مراکز ذخیرهسازی داده محلی است که ادعا میکند میتواند نیازهای محاسباتی توزیعشده حجمهای کاری مدرن هوش مصنوعی را برآورده کند. به گفته طارق، پلتفرم ذخیرهسازی بومی هوش مصنوعی این استارتاپ “همراه با محاسبات شما حرکت میکند، به دادهها اجازه میدهد به طور خودکار در جایی که پردازندههای گرافیکی (GPU) هستند تکثیر شوند، از میلیاردها فایل کوچک پشتیبانی میکند و دسترسی با تأخیر کم برای آموزش، استنتاج و حجمهای کاری مرتبط با عاملها را فراهم میکند.”
برای انجام همه این کارها، Tigris اخیراً در یک دور سرمایهگذاری سری A، مبلغ 25 میلیون دلار جمعآوری کرده است که توسط Spark Capital رهبری شد و سرمایهگذاران فعلی، از جمله Andreessen Horowitz نیز در آن شرکت داشتند. خبرنگار اختصاصاً مطلع شده است که این استارتاپ در حال رقابت با شرکتهای بزرگ و جاافتادهای است که طارق آنها را “ابر بزرگ” مینامد.

طارق معتقد است که این شرکتهای بزرگ و جاافتاده نهتنها خدمات ذخیرهسازی داده گرانتری ارائه میدهند، بلکه خدمات آنها کارایی کمتری هم دارد. AWS، Google Cloud و Microsoft Azure از نظر تاریخی هزینههای خروجی (که در صنعت به آن “مالیات ابری” میگویند) را در صورتی از مشتری دریافت میکنند که بخواهد به یک ارائهدهنده خدمات ابری دیگر مهاجرت کند، یا دادههای خود را دانلود و منتقل کند تا، مثلاً، از یک پردازنده گرافیکی ارزانتر استفاده کند یا مدلها را به طور همزمان در بخشهای مختلف جهان آموزش دهد. این مانند این است که اگر بخواهید دیگر به باشگاه ورزشی نروید، مجبور باشید به آن پول بیشتری بپردازید.
به گفته باتوهان تاسکایا، رئیس بخش مهندسی در Fal.ai، یکی از مشتریان Tigris، این هزینهها زمانی بخش عمدهای از هزینههای ابری Fal را تشکیل میداد.
طارق میگوید فراتر از هزینههای خروجی، همچنان مشکل تأخیر با ارائهدهندگان خدمات ابری بزرگتر وجود دارد. او گفت: «هزینههای خروجی فقط یک علامت از یک مشکل عمیقتر بود: ذخیرهسازی متمرکز که نمیتواند با یک اکوسیستم هوش مصنوعی غیرمتمرکز و پرسرعت همراهی کند.»
بیشتر از 4000 مشتری Tigris مانند Fal.ai هستند: استارتاپهای هوش مصنوعی مولد که مدلهای تصویر، ویدئو و صدا میسازند و معمولاً مجموعه دادههای بزرگ و حساس به تأخیر دارند.
طارق گفت: «تصور کنید با یک عامل هوش مصنوعی صحبت میکنید که در حال انجام پردازش صوتی محلی است. شما کمترین تأخیر را میخواهید. شما میخواهید محاسبات شما محلی و نزدیک باشد و میخواهید ذخیرهسازی شما نیز محلی باشد.»
او افزود که ابرهای بزرگ برای حجمهای کاری هوش مصنوعی بهینه نشدهاند. جریاندهی مجموعه دادههای عظیم برای آموزش یا اجرای استنتاج بلادرنگ در مناطق مختلف میتواند گلوگاههای تأخیر ایجاد کند و عملکرد مدل را کند نماید. اما امکان دسترسی به ذخیرهسازی محلی به این معنی است که دادهها سریعتر بازیابی میشوند، که به این معنی است که توسعهدهندگان میتوانند حجمهای کاری هوش مصنوعی را به طور قابل اعتماد و با هزینه کمتری با استفاده از ابرهای غیرمتمرکز اجرا کنند.
تاسکایا از Fal گفت: «Tigris به ما امکان میدهد حجمهای کاری خود را در هر ابری مقیاسبندی کنیم و با فراهم کردن دسترسی به یک سیستم فایل داده مشابه از همه این مکانها، بدون دریافت هزینه خروجی این کار را انجام میدهد.»
دلایل دیگری نیز وجود دارد که چرا شرکتها میخواهند دادهها را به گزینههای ابری توزیعشده خود نزدیکتر داشته باشند. به عنوان مثال، در زمینههایی که به شدت تحت نظارت هستند مانند امور مالی و مراقبتهای بهداشتی، یک مانع بزرگ بر سر راه پذیرش ابزارهای هوش مصنوعی این است که شرکتها باید از امنیت دادهها اطمینان حاصل کنند.
طارق میگوید انگیزه دیگر این است که شرکتها به طور فزایندهای میخواهند مالک دادههای خود باشند، و به این موضوع اشاره میکند که چگونه Salesforce در اوایل سال جاری میلادی رقبای هوش مصنوعی خود را از استفاده از دادههای Slack منع کرد. طارق گفت: «شرکتها بیش از پیش متوجه اهمیت دادهها، نحوه سوخترسانی آنها به مدلهای زبانی بزرگ (LLM)، و نحوه سوخترسانی آنها به هوش مصنوعی میشوند. آنها میخواهند کنترل بیشتری داشته باشند. آنها نمیخواهند شخص دیگری کنترل آن را در دست داشته باشد.»
Tigris قصد دارد با استفاده از بودجه جدید، به ساخت مراکز ذخیرهسازی داده خود برای پشتیبانی از افزایش تقاضا ادامه دهد – طارق میگوید این استارتاپ از زمان تأسیس خود در آبان ماه سال 1400، هر سال 8 برابر رشد داشته است. Tigris در حال حاضر سه مرکز داده در ویرجینیا، شیکاگو و سن خوزه دارد و میخواهد به گسترش خود در ایالات متحده و همچنین در اروپا و آسیا، به ویژه در لندن، فرانکفورت و سنگاپور ادامه دهد.