هل يمكن للكفاءة أن تتحدى عمالقة الذكاء الاصطناعي؟دخلت Google المرحلة التالية من منافسة عتاد الذكاء الاصطناعي بإطلاق Ironwood، وحدة المعالجة Tensor من الجيل السابع. ومع التركيز على تجاوز تسريع الذكاء الاصطناعي العام، صممت Google Ironwood خصيصًا لعمليات الاستدلال – وهي المهمة الحاسمة لتشغيل النماذج المدربة على نطاق واسع. هذا التركيز يشير إلى رهان كبير على "عصر الاستدلال"، حيث تصبح كفاءة وتكلفة نشر الذكاء الاصطناعي، بدلاً من تدريبه فقط، من العوامل الأساسية لاعتماده من قبل الشركات وتحقيق الأرباح، مما يضع Google في مواجهة مباشرة مع الشركات الرائدة مثل NVIDIA وIntel.
يقدم Ironwood تطورات كبيرة في قوة الحوسبة الخام، والأهم من ذلك، في كفاءة استهلاك الطاقة. قد تكون ميزة الأداء لكل واط المتفوقة هي العامل التنافسي الأقوى، حيث يوفر قدرات حسابية عالية (تيرافلوبس) وزيادة كبيرة في عرض النطاق الترددي للذاكرة مقارنة بالجيل السابق. وتؤكد Google أن الكفاءة تضاعفت تقريبًا، مما يعالج التحديات التشغيلية الرئيسية المتمثلة في استهلاك الطاقة والتكلفة في نشر الذكاء الاصطناعي على نطاق واسع. هذا السعي نحو الكفاءة، مع عقد من التكامل العمودي في تصميم وحدات TPU الخاصة بها، يخلق بنية متكاملة بين العتاد والبرمجيات قد تقدم مزايا كبيرة في إجمالي تكلفة الملكية.
من خلال التركيز على كفاءة الاستدلال والاستفادة من نظامها البيئي المتكامل، بما في ذلك الشبكات والتخزين وإطار العمل Pathways (باثوايز)، تهدف Google إلى انتزاع حصة كبيرة من سوق معجلات الذكاء الاصطناعي. يتم تقديم Ironwood ليس فقط كرقاقة، بل كأساس للنماذج المتقدمة مثل Gemini ودعامة لمستقبل أنظمة الذكاء الاصطناعي المعقدة متعددة العوامل. هذه الاستراتيجية الشاملة تتحدى بشكل مباشر هيمنة NVIDIA المتأصلة وطموحات Intel المتزايدة في مجال الذكاء الاصطناعي، مما يشير إلى أن معركة الريادة في بنية الذكاء الاصطناعي التحتية تحتدم حول اقتصاديات النشر.