
چیپهای هوش مصنوعی در مرکز یک رقابت شتابان بین شرکتهای تولیدکننده چیپ هوش مصنوعی (ai chip companies) قرار دارند؛ رقابتی که روی عملکرد، کارایی و مقیاس متمرکز است. وقتی بازیگر بزرگ ابر و تجارت الکترونیک مانند علیبابا از یک چیپ هوش مصنوعی جدید رونمایی میکند، بازارها و خریداران توجه میکنند — نه به این دلیل که هر چیپ قرار است یکشبه NVIDIA یا AMD را از میدان خارج کند، بلکه چون هر رقیب جدید انتخابها را برای اپراتورهای دیتاسنتر، مشتریان ابری و سازندگان دستگاههای لبهای بازتعریف میکند. این مقاله توضیح میدهد که چپ جدید هوش مصنوعی علیبابا برای صنعت چه معنایی دارد و نشان میدهد که سازندگان چیپ و شرکتهای تولیدکننده چیپ چگونه در یک اکوسیستم گستردهتر جای میگیرند.
در ادامه یک توضیح مقدماتی و دوستانه درباره چیپهای هوش مصنوعی، مقایسهای عملی از دید خریدار، تجزیهوتحلیل زنجیره تأمین، رهبران منطقهای که باید زیر نظر داشت و تحلیلی متعادل درباره اینکه آیا اعلامیه علیبابا واقعاً تغییردهنده بازی برای training، inference و استقرار است یا خیر، خواهید یافت.
درک چیپهای هوش مصنوعی: راهنمایی برای مبتدیان
در سادهترین شکل، یک چیپ هوش مصنوعی پردازندهای تخصصی است که برای اجرای بارهای کاری یادگیری ماشین بهطرز بهینهتری نسبت به یک CPU عمومی طراحی شده است. در حالی که CPU برای انعطافپذیری در طیف وسیعی از وظایف ساخته شده، چیپهای هوش مصنوعی بخشی از عمومیت را فدا میکنند تا موازیسازی گسترده، توانمندی محاسبات ماتریسی سنگین و معماریهای حافظهای که با وزنها و فعالسازیهای مدل سازگارند را فراهم کنند.
تفاوت چیپهای هوش مصنوعی با CPU، GPU، TPU و ASIC
- CPU: پردازش کنترل عمومی و سریالی. مناسب برای هماهنگی و وظایف inference سبک، اما برای محاسبات ماتریسی بزرگ بهینه نیست.
- GPU: هستههای موازی گسترده که برای گرافیک طراحی شده بودند ولی برای training و inference بازتخصیص یافتهاند. بهدلیل اکوسیستم نرمافزاری بالغ، بهطور گسترده استفاده میشوند.
- TPU: Tensor Processing Unit — شتابدهنده درونسازمانی Google که برای ریاضیات تانسوری و یادگیری عمیق طراحی شده و اغلب بهصورت سرویس ابری در دسترس است.
- ASIC: Application-Specific Integrated Circuit — سیلیکون سفارشی ساختهشده برای یک کار محدود (مثلاً موتور inference اختصاصی). ASICها میتوانند بهترین کارایی انرژی را برای آن وظیفه ارائه دهند اما انعطافپذیری کمی دارند.
- FPGA: بستر قابل پیکربندی که میتوان آن را با توجه به بار کاری تنظیم کرد؛ در مواقعی که انعطافپذیری یا نمونهسازی نیاز است، استفاده میشود.
میتوان چیپهای هوش مصنوعی را بهعنوان دستهای در نظر گرفت که با GPU، TPU و ASIC همپوشانی دارد؛ این برچسب بیشتر بر هدف کاربردی تأکید میکند تا یک انتخاب میکرومعماری واحد. خریداران هنگام انتخاب بین گزینهها باید نوع مدلها، الزامات تأخیر، بودجه انرژی و اینکه تمایل به استقرار در cloud یا on-prem دارند را وزن کنند.
چپ جدید هوش مصنوعی علیبابا: تغییردهنده بازی؟
اعلامیه علیبابا درباره چیپ جدید هوش مصنوعی امسال نشاندهنده ورود یک ارائهدهنده بزرگ ابری دیگر به میدان سیلیکون است. شرکت این طراحی را برای inference ابری و training مدلهای بزرگ در دیتاسنترهای خود چارچوببندی کرده و دسترسی نرمافزاری به سرویسهای Alibaba Cloud قرار داده است.
نکاتی که در عرضه محصول باید زیر نظر داشت:
- پشته نرمافزاری و فریمورکها — سازگاری با TensorFlow، PyTorch و ONNX اغلب سرعت پذیرش را تعیین میکند.
- معماری حافظه و interconnect — پشتیبانی از high-bandwidth memory (HBM) و fabric کارآمد برای مدلهای بزرگ اهمیت دارد.
- مدل استقرار — اینکه علیبابا این چیپ را تنها بهعنوان یک شتابدهنده ابری عرضه کند یا سختافزار را برای استفاده on-prem نیز فراهم نماید.
آیا این یک تغییردهنده بازی است؟ پاسخ بستگی به سه خروجی عملی دارد: (1) آیا بنچمارکهای دنیای واقعی با ادعاهای شرکت مطابقت دارند، (2) بلوغ زنجیره ابزار نرمافزاری و اکوسیستم چقدر است، و (3) آیا شرکای زنجیره تأمین میتوانند ظرفیت و پهنای باند حافظه مورد نیاز را تأمین کنند. یک رقیب جدید میتواند انتخابها را افزایش دهد و روی بازیگران فعلی فشار وارد کند، اما اکوسیستم و مقیاس همچنان تعیینکنندهاند.
چشمانداز چیپ هوش مصنوعی: بازیگران کلیدی و دستهبندیها
جهان شرکتهای ai chip companies ترکیبی از فروشندگان سیلیکون سنتی، hyperscalerهای ابری، استارتاپهای fabless و متخصصان ASIC عمودی را در بر دارد. دستهبندیها شامل:
- چیپهای طراحیشده توسط hyperscalerها: ارائهدهندگان ابری که برای کاهش هزینههای ابر و متمایزسازی خدمات خود شتابدهندههای داخلی طراحی میکنند.
- پیشرویان GPU: شتابدهندههای عمومی که برای بارهای کاری AI بازتخصیص یافتهاند.
- متخصصان ASIC: شرکتهایی که شتابدهندههای باریکبُرد و با کارایی بالا برای inference یا کلاسهای مدل مشخص میسازند.
- شتابدهندههای تحقیقمحور: استارتاپهایی که توپولوژیهای جایگزین مانند systolic arrays یا wafer-scale designs را بررسی میکنند.
نامهای نماینده برای پیگیری: فروشندگان GPU شناختهشده و شرکتهای سیلیکونی مستقر؛ بازیگران ابری که طراحیهای داخلی تولید میکنند؛ و استارتاپهایی که هدفشان پروفایلهای توان یا تأخیر خاص است. هنگام مقایسه تولیدکنندگان، روی مورد استفاده، پشتیبانی نرمافزاری، محدوده توان و نحوه یکپارچهسازی فروشنده با زیرساختهای ابری یا on-prem موجود تمرکز کنید.
موارد استفاده از چیپهای هوش مصنوعی: Training در مقابل Inference
بارهای کاری AI به دو دسته کلی تقسیم میشوند که انتخاب سختافزارهای متفاوتی را رقم میزنند:
- Training: ساخت یا فاینتیون مدلها. Training به محاسبات خام بالا، ظرفیت حافظه بزرگ و fabric بینگرهای عالی برای بارهای توزیعشده نیاز دارد. کارایی انرژی مهم است اما توان عملیاتی و مقیاس مدل الویت دارند.
- Inference: اجرای مدل آموزشدیده برای ارائه پیشبینیها. Inference اغلب تأخیر، هزینه به ازای هر پرسوجو و کارایی انرژی را در اولویت قرار میدهد. بسیاری از استقرارهای لبهای و موبایل به فرمفکتورهای کوچک و بودجههای انرژی محدود نیاز دارند.
مقایسه عملی برای خریداران (ماتریس کاربردی)
- مورد استفاده: Training — GPU، TPU و چیپهای هوش مصنوعی ردهبالا. Inference — ASICها، چیپهای تخصصی inference، GPUهای کممصرف.
- تمرکز عملکرد: Training — توان عملیاتی و مقیاسپذیری. Inference — تأخیر و هزینه-به-ازای-inference.
- کارایی انرژی: Inference در لبه ترجیح میدهد طراحیهای بسیار کارآمد که اغلب ASIC یا NPUهای تخصصی هستند. Training دیتاسنتری از خنکسازی و تأمین توان استفاده میکند تا توان عملیاتی را در اولویت قرار دهد.
- استقرار: Training در cloud و on-prem به راهکارهای مقیاس رک نیاز دارد؛ inference لبهای به ماژولهای جمعوجور یا SoCهای یکپارچه نیازمند است.
اعلامیه علیبابا بهنظر میرسد هدف مشتریان ابری را که هم به inference و هم به فاینتیون مدلهای بزرگ نیاز دارند، نشانه رفته است، اما تصمیم نهایی خریداران بر اساس عملکرد بنچمارکشده به ازای وات و قدرت یکپارچگی ابری تعیین خواهد شد.
عملکرد چیپ هوش مصنوعی: کارایی انرژی و استقرار
عملکرد چندوجهی است. چیپها اغلب بر اساس توان عملیاتی (چه تعداد عملیات در ثانیه)، تأخیر (زمان پاسخ) و مصرف انرژی بهازای هر عملیات سنجیده میشوند. خریداران باید در نظر داشته باشند:
- پروفایل بار کاری: ضرب ماتریسی متراکم، مکانیزمهای attention پراکنده یا mixed precision هرکدام بهطرز متفاوتی با سختافزار تعامل دارند.
- معماری حافظه: SRAM روی چیپ در مقابل HBM خارجی مشخص میکند مدلهای بزرگ چگونه روی سیلیکون نقشهبرداری میشوند و آیا پهنای باند خارج از چیپ به گلوگاه تبدیل میشود یا خیر.
- زیرنویسههای حرارتی و توان: دیتاسنترها میتوانند خنکسازی قابلتوجهی فراهم کنند؛ دستگاههای لبهای نمیتوانند. بنابراین کارایی زمینهای است.
انتخابهای استقرار نیز خرید سختافزار را تحت تأثیر قرار میدهد: خریداران cloud-first ممکن است شتابدهندههایی را ترجیح دهند که با خدمات ارائهدهنده یکپارچه شدهاند، در حالی که شرکتهایی با محدودیتهای تطبیقپذیری نیاز به راهکارهای on-prem با تجارتهای متفاوت عملکرد و مصرف توان خواهند داشت.
زنجیره تأمین چیپ هوش مصنوعی: از طراحی تا استقرار
درک اینکه چه کسی در زنجیره تأمین چه کاری انجام میدهد، مشخص میکند کجا گلوگاهها ظاهر میشوند و کدام شرکتها برای تحویل اهمیت دارند.
طراحی
بیشتر چیپهای مدرن هوش مصنوعی از شرکتهای fabless یا تیمهای طراحی داخلی در ارائهدهندگان ابری منشأ میگیرند. خانههای طراحی معماری، میکرومعماری و جریانهای اعتبارسنجی را ایجاد میکنند.
تولید (Foundries)
Foundryها ویفرهای سیلیکونی را تولید میکنند. بازیگران بزرگ جهانی فرآیند نودهای پیشرفته و ظرفیت را تأمین میکنند و انتخاب foundry بر بازده، ویژگیهای توان و دسترسی به نودهای برتر تأثیر میگذارد.
تأمینکنندگان حافظه
فروشندگان high-bandwidth memory و تأمینکنندگان DRAM ماژولهای حافظهای را فراهم میکنند که امکان بارهای کاری AI با توان بالا را میسر میسازند. در دسترس بودن حافظه اغلب عملکرد اوج برای مدلهای بزرگ را محدود میکند.
بستهبندی و تست
شرکتهای بستهبندی پیشرفته دیها را مونتاژ، HBM را یکپارچه و راهحلهای interposer یا chiplet را فراهم میکنند. انتخابهای بستهبندی بر تأخیر بین محاسبه و حافظه تأثیر دارد.
نرمافزار و یکپارچهکنندگان سیستم
زنجیرههای ابزار نرمافزاری، کامپایلرها و یکپارچهکنندگان ابر چیپها را قابل استفاده میکنند. بدون پشتیبانی بالغ از فریمورکهای متداول ML، حتی سیلیکون از نظر فنی توانمند نیز برای پذیرش مشکل خواهد داشت.
OEMهای ابری و لبه
ارائهدهندگان ابری، OEMهای سرور و سازندگان ماژولهای لبهای چیپها را در مقیاس مستقر میکنند. تصمیمات خرید و قراردادهای آنها با foundryها و تأمینکنندگان حافظه شکلدهنده در دسترس بودن عرضه هستند.
خلاصه اینکه یک ai chip manufacturer اغلب یک گره در زنجیرهای توزیعشده است که شامل دارندگان IP، foundryها، شرکتهای بستهبندی، تأمینکنندگان حافظه و یکپارچهکنندگان است. حرکت علیبابا بسیاری از این پیوندها را تحتتأثیر قرار میدهد: شرکت باید طراحی، تخصیص foundry، تأمین حافظه و نرمافزار را برای موفقیت در مقیاس هماهنگ کند.
رهبران منطقهای در تولید چیپ هوش مصنوعی
رهبری چیپ هوش مصنوعی بهصورت جغرافیایی پراکنده است. خارج از اکوسیستمهای غالب ایالات متحده، تایوان و چین، مناطق دیگر در حال ساخت توانمندی و تخصصهای کوچک هستند.
- اروپا — شرکتهایی مانند Graphcore و SiPearl توپولوژیهای نوآورانه و اهداف محاسبات حاکمیتی را در همکاری با برنامههای ابری و HPC منطقهای دنبال میکنند.
- اسرائیل — صحنه استارتاپی پُرجوش شامل شتابدهندههای متمرکز بر inference و شرکتهای مالک IP؛ نمونههای تاریخی قابلتوجهی وجود دارند که توسط گروههای بزرگتر نیمههادی خریداری شدهاند.
- کره جنوبی — ظرفیت حافظه و تولید عمده از شرکتهایی که همچنین خدمات بستهبندی و یکپارچهسازی ارائه میدهند، با نقش جهانی Samsung در تولید.
- ژاپن — بازیگران سنتی و یکپارچهکنندگان سیستمی که روی پردازندههای تخصصی، طراحیهای کممصرف و استقرار در مقیاس سازمانی تمرکز دارند.
پیگیری رهبران منطقهای تنها درباره توان ملی نیست؛ درباره اکوسیستمهاست. foundryها در تایوان، حافظه در کره جنوبی و شرکتهای بستهبندی در جنوبشرقی آسیا وابستگی متقابلی ایجاد میکنند که تعیین میکند چه کسی میتواند تولید را سریع مقیاس دهد.
اکوسیستم چیپ هوش مصنوعی: فراتر از طراحان چیپ
شرکتهایی که فراتر از طراحان چیپ اهمیت دارند عبارتاند از:
- تأمینکنندگان حافظه — فروشندگان HBM و DRAM که پهنای باند مؤثر در دسترس مدلها را تعیین میکنند.
- خانههای بستهبندی و تست — شرکتهای بستهبندی پیشرفته که طراحیهای chiplet و پشتههای HBM با چگالی بالا را ممکن میسازند.
- یکپارچهکنندگان ابری و hyperscalerها — شرکتهایی که چیپها را بهصورت نمونههای مدیریتشده یا دستگاههای آمادهبهکار مستقر میکنند.
- فروشندگان نرمافزار و میدلویر — کامپایلرها، runtimeها و ابزارهای بهینهسازی مدل که فریمورکها را به اجرای کارآمد ترجمه میکنند.
- استارتاپها و شتابدهندههای نیچ — شرکتهایی که توپولوژیهای جایگزین، NPUهای کممصرف لبهای و شتابدهندههای دامنهمحور برای بینایی، صوت یا پردازش سیگنال را بررسی میکنند.
جریانهای نمونهای اکوسیستم: یک شرکت fabless چیپ هوش مصنوعی یک دی را طراحی میکند، تخصیص foundry را تضمین میکند، HBM را از تأمینکنندگان حافظه تهیه مینماید، بستهبندی را با یک خانه تخصصی قرارداد میبندد و با ارائهدهندگان ابری یا OEMها برای استقرار همکاری میکند. اختلال در هر مرحله — برای مثال کمبود حافظه یا زمانهای طولانی بستهبندی — میتواند عرضه را محدود کند حتی اگر طراحی از منظر فنی مناسب باشد.
سؤالات متداول
چیپهای هوش مصنوعی چه هستند و چگونه با CPU، GPU، TPU و ASIC تفاوت دارند؟
چیپهای هوش مصنوعی پردازندههایی هستند که برای وظایف یادگیری ماشین بهینه شدهاند. CPUها عمومی هستند، GPUها محاسبات موازی فراهم میکنند که برای AI بازتخصیص یافتهاند، TPUها شتابدهندههای متمرکز بر تانسور Google هستند، و ASICها چیپهای سفارشی برای وظایف محدودند. هرکدام بسته به بار کاری و مدل استقرار بین انعطافپذیری، کارایی و عملکرد تبادل میکنند.
اصلیترین موارد استفاده از چیپهای هوش مصنوعی کداماند؟
موارد استفاده اصلی بین training مدلهای بزرگ و اجرای inference تقسیم میشود. Training به توان عملیاتی بالا و ظرفیت حافظه نیاز دارد؛ inference نیازمند تأخیر پایین و کارایی انرژی بالا است، بهویژه در لبه. کاربردهای دیگر شامل پیشپردازش داده، quantisation مدل و پردازش سیگنال تخصصی است.
چپ جدید هوش مصنوعی علیبابا چگونه با راهحلهای موجود از NVIDIA، AMD و سایر تولیدکنندگان مقایسه میشود؟
چیپ جدید علیبابا بهعنوان یک شتابدهنده متمرکز بر ابر و طراحیشده برای هر دو کار بارهای inference و مدلهای بزرگ موقعیتیابی شده است. مقایسه مستقیم نیاز به بنچمارکهای مستقل و بررسی بلوغ نرمافزاری دارد. بازیگران فعلی همچنان در گستره اکوسیستم و پشتههای نرمافزاری اثباتشده رقابت میکنند، در حالی که رقبای جدید بر قیمت، یکپارچگی و بهینهسازیهای مشخص تأکید میکنند.
زنجیره تأمین چیپ هوش مصنوعی چیست و بازیگران کلیدی در هر مرحله چه کسانی هستند؟
زنجیره تأمین شامل طراحی (fabless یا IP درونسازمانی)، تولید (foundryها)، حافظه (HBM/DRAM)، بستهبندی (خانههای مونتاژ پیشرفته)، فروشندگان نرمافزار/ابزار و یکپارچهکنندگان ابری یا OEM است. هر مرحله حیاتی است: foundryها و تأمینکنندگان حافظه اغلب مقیاس تولید و زمانبندی را تعیین میکنند.
در سالهای آتی کدام رهبران منطقهای در تولید چیپ هوش مصنوعی ارزش پیگیری دارند؟
فراتر از ایالات متحده، تایوان را برای ظرفیت پیشرو foundry، کره جنوبی را برای قدرت حافظه و تولید، اروپا را برای استارتاپهای معماری نو، اسرائیل را برای نوآوری متمرکز بر inference و ژاپن را برای پردازندههای تخصصی و یکپارچهسازی سیستم تحت نظر داشته باشید. راهبردهای ملی و مشارکتهای زنجیره تأمین شکلدهنده رهبران خواهند بود.
نتیجهگیری
چپ جدید هوش مصنوعی علیبابا یک گزینه قابلتوجه جدید برای مشتریان ابری میافزاید و صنعتیشدن سیلیکون AI را برجسته میکند. برای خریداران، عوامل تعیینکننده سازگاری نرمافزاری، معماری حافظه و interconnect و قابلیت اطمینان زنجیره تأمین است که سیلیکون را در مقیاس به رکها میرساند. ورود بازیگران جدید انتخابها را گسترش میدهد، اما بلوغ اکوسیستم و بنچمارکها تأثیر واقعی در دنیای واقعی را مشخص میکنند.
برای معاملهگران و سرمایهگذارانی که بخشهای نیمههادی و ابری را رصد میکنند، درک زنجیره تأمین و بازیگران اکوسیستم ضروری است. STB Venture در حال پیگیری تحولات فناوری چیپ هوش مصنوعی است و تیمهای محصول STB منابعی را ارائه میدهند که تحقیق را به اجرا پیوند میدهد — دیدگاههای ما را در /venture/ai-investments و ابزارهای مرتبط با بازار در /brokers/ai-driven-tools ببینید. در صورت بررسی محصولات سرمایهگذاری مرتبط با این موضوعات، توجه داشته باشید که CFD trading و ابزارهای اهرمی دارای ریسک هستند؛ عملکرد گذشته شاخصی برای نتایج آتی نیست و شما باید قبل از معامله از ریسکها آگاه باشید. برای چارچوبهای تخصیص اختیاری، پیشنهاداتی مانند /investment/pamm/ai و مطالب آموزشی در STB Academy را برای ساخت دانش حوزه بررسی کنید.
Ready to start trading?
Put what you've learned into practice.