با بلوغ شرکتهای هوش مصنوعی، رقابت برای دستیابی به دادههای با کیفیت بالا به یکی از مهمترین حوزهها در این صنعت تبدیل شده است. این رقابت، شرکتهایی مانند مرکور، سورج و به ویژه Scale AI متعلق به الکساندر وانگ را به صحنه آورده است. اما اکنون که وانگ به متا رفته تا هوش مصنوعی را در آنجا مدیریت کند، بسیاری از سرمایهگذاران فرصتی را میبینند و تمایل دارند از شرکتهایی با استراتژیهای جدید و جذاب برای جمعآوری دادههای آموزشی حمایت مالی کنند.
یکی از این شرکتها، Datacurve است که از فارغالتحصیلان Y Combinator بوده و بر دادههای با کیفیت بالا برای توسعه نرمافزار تمرکز دارد. این شرکت روز پنجشنبه، ۱۸ مهر ۱۴۰۴، از جذب سرمایه ۱۵ میلیون دلاری در دور Series A خبر داد. این دور به رهبری مارک گلدبرگ از Chemistry و با مشارکت کارکنانی از DeepMind، Vercel، Anthropic و OpenAI انجام شد. دور Series A پس از جذب ۲.۷ میلیون دلار در دور seed انجام میشود که سرمایهگذاری از بالاجی سرینیواسان، مدیر ارشد فناوری سابق Coinbase را نیز به خود جذب کرده بود.
Datacurve از یک سیستم “شکارچی جایزه” برای جذب مهندسان نرمافزار ماهر به منظور تکمیل سختترین مجموعه دادهها استفاده میکند. این شرکت بابت این مشارکتها پول پرداخت میکند و تاکنون بیش از ۱ میلیون دلار جایزه توزیع کرده است.
اما سرنا گی (تصویر بالا به همراه چارلی لی، بنیانگذار دیگر) میگوید که بزرگترین انگیزه، مالی نیست. برای خدمات ارزشمندی مانند توسعه نرمافزار، پرداخت برای کار داده همیشه بسیار کمتر از استخدام معمولی خواهد بود؛ بنابراین مهمترین مزیت این شرکت، تجربه کاربری مثبت است.
گی گفت: «ما این را به عنوان یک محصول مصرفی در نظر میگیریم، نه یک عملیات برچسبگذاری داده. ما زمان زیادی را صرف این فکر میکنیم که چگونه میتوانیم آن را بهینه کنیم تا افرادی که میخواهیم، علاقهمند شوند و وارد پلتفرم ما شوند؟»
این موضوع به ویژه با پیچیدهتر شدن نیازهای دادههای پس از آموزش اهمیت پیدا میکند. در حالی که مدلهای اولیه بر روی مجموعه دادههای ساده آموزش داده میشدند، محصولات هوش مصنوعی امروزی متکی به محیطهای پیچیده RL هستند که باید از طریق جمعآوری دادههای خاص و استراتژیک ساخته شوند. با پیچیدهتر شدن محیطها، الزامات داده هم از نظر کمیت و هم از نظر کیفیت شدیدتر میشوند؛ عاملی که میتواند به شرکتهای جمعآوری داده با کیفیت بالا مانند Datacurve برتری دهد.
Datacurve به عنوان یک شرکت نوپا، بر مهندسی نرمافزار متمرکز است، اما گی میگوید که این مدل میتواند به راحتی در زمینههایی مانند امور مالی، بازاریابی یا حتی پزشکی نیز کاربرد داشته باشد.
گی میگوید: «کاری که ما در حال حاضر انجام میدهیم، ایجاد زیرساختی برای جمعآوری دادههای پس از آموزش است که افراد بسیار شایسته را در حوزههای خود جذب و حفظ میکند.»