InfiniMind: زیرساخت هوش مصنوعی برای تحلیل دادههای ویدیویی انبارشده شرکتها
استارتاپ InfiniMind که توسط مدیران سابق گوگل ژاپن تأسیس شده، زیرساختهای سازمانی هوش مصنوعی برای تبدیل آرشیوهای ویدیویی بزرگ به هوش تجاری جستجوپذیر ایجاد میکند. آنها اخیراً جذب سرمایه اولیه داشتهاند و دفتر خود را به آمریکا منتقل میکنند.

زیرساخت هوش مصنوعی برای تحلیل دادههای ویدیویی سازمانی
شرکتها امروزه حجم فزایندهای از دادههای ویدیویی تولید میکنند؛ از آرشیوهای پخش تا فیلمهای دوربینهای مداربسته و محتوای تولیدی. این حجم عظیم ویدیو که اغلب به صورت بلااستفاده روی سرورها باقی میماند، “داده تاریک” نامیده میشود؛ منبعی غنی که تقریباً هرگز به صورت معناداری مورد استفاده قرار نمیگیرد. برای حل این چالش، آیزا کای (مدیرعامل) و هیراکو یاناگیا (مدیر عملیات)، دو مهندس سابق گوگل که سابقهای طولانی در گوگل ژاپن داشتند، شرکت InfiniMind را در توکیو تأسیس کردند. این استارتاپ در حال توسعه زیرساختی است که قادر است پتابایتها ویدیو و صوت تحلیلنشده را به دادههای تجاری ساختاریافته و قابل پرسوجو تبدیل کند.
تغییر کلیدی در این حوزه، پیشرفتهای چشمگیر در مدلهای بینایی-زبانی (vision-language models) بین سالهای ۲۰۲۱ تا ۲۰۲۳ بوده است. پیش از این، راهحلهای موجود صرفاً قادر به برچسبگذاری اشیاء در فریمهای مجزا بودند و نمیتوانستند روایتها یا علیتهای موجود در محتوای ویدیو را درک کنند. با بالغ شدن فناوری هوش مصنوعی ویدیو، InfiniMind توانست بر مشکلاتی نظیر پاسخگویی به سوالات پیچیده درباره محتوای ویدیو غلبه کند.
- تمرکز ویژه: InfiniMind بر موارد استفاده سازمانی (enterprise use cases) شامل نظارت، ایمنی، امنیت و تحلیل عمیق محتوای ویدیویی تمرکز دارد، برخلاف راهحلهای عمومیتر.
- محصولات کلیدی: محصول اولیه آنها، TV Pulse، محتوای تلویزیونی را در لحظه تحلیل میکند تا حضور برند و تاثیرات روابط عمومی را بسنجد. محصول پرچمدار آینده، DeepFrame، یک پلتفرم هوشمندسازی ویدیوی بلند است که توانایی پردازش ۲۰۰ ساعت فیلم برای یافتن صحنههای خاص را دارد.
- مزیت رقابتی: راهحل آنها بدون نیاز به کدنویسی است و علاوه بر تصاویر، صدا و گفتار را نیز درک میکند. این سیستم طول ویدیوی نامحدودی را پردازش کرده و از نظر کارایی هزینه، یک تمایز عمده با راهحلهای رقیب ایجاد میکند.
- تأمین مالی: این شرکت اخیراً ۵.۸ میلیون دلار سرمایه اولیه (Seed funding) جذب کرده است تا توسعه مدل DeepFrame و گسترش زیرساخت مهندسی خود را ادامه دهد.
آیزا کای معتقد است: “درک هوش عمومی ویدیو، در واقع درک واقعیت است. اهداف صنعتی مهم هستند، اما هدف نهایی ما پیشبرد مرزهای فناوری برای درک بهتر واقعیت و کمک به انسانها برای تصمیمگیری بهتر است.”
InfiniMind در حال حاضر دفتر مرکزی خود را به ایالات متحده منتقل میکند، هرچند که عملیات خود را در ژاپن ادامه میدهد. ژاپن به عنوان یک بستر آزمایشی عالی برای تنظیم دقیق فناوری پیش از ورود به بازار جهانی عمل کرد.
یکی از بنیانگذاران اظهار داشت: “تا سال ۲۰۲۴، فناوری به بلوغ رسیده بود و تقاضای بازار آنقدر واضح شد که متقاعد شدیم خودمان شرکت را بسازیم.”
InfiniMind قصد دارد با تقویت زیرساختهای خود، به سوی اهداف بزرگتر حرکت کند و در نهایت به درک جامعتری از دادههای تصویری و صوتی در صنایع مختلف دست یابد.

