لینگوا لینکد: توانمندسازی دستگاههای موبایل با مدلهای زبانی بزرگ توزیعشده
تقاضا برای استقرار مدلهای زبانی بزرگ (LLMs) بر روی دستگاههای موبایل در حال افزایش است، که ناشی از نیاز به حفظ حریم خصوصی، کاهش تأخیر و استفاده کارآمد از پهنای باند است. با این حال، نیازهای گسترده حافظه و محاسباتی LLMها چالشهای قابل توجهی را ایجاد میکند. وارد لینگوا لینکد شوید، یک سیستم جدید که توسط گروهی از پژوهشگران دانشگاه UC Irvine توسعه یافته است، طراحی شده تا استنتاج LLMهای غیرمتمرکز و توزیعشده را در چندین دستگاه موبایل امکانپذیر کند و از قابلیتهای جمعی آنها برای انجام وظایف پیچیده به طور کارآمد استفاده کند.

چالش
استقرار LLMهایی مانند GPT-3 یا BLOOM بر روی دستگاههای موبایل به دلیل:
- محدودیتهای حافظه: LLMها نیاز به حافظه زیادی دارند که اغلب از ظرفیت دستگاههای موبایل فردی فراتر میرود.
- محدودیتهای محاسباتی: دستگاههای موبایل معمولاً قدرت پردازش محدودی دارند که اجرای مدلهای بزرگ را دشوار میکند.
- نگرانیهای حریم خصوصی: ارسال دادهها به سرورهای متمرکز برای پردازش مسائل حریم خصوصی را به وجود میآورد.
راهحل لینگوا لینکد

لینگوا لینکد با سه استراتژی کلیدی این چالشها را برطرف میکند:
-
تخصیص بهینه مدل:
- سیستم LLMها را به زیرگرافهای کوچکتر تقسیم میکند و با استفاده از بهینهسازی خطی هر بخش را با قابلیتهای یک دستگاه تطبیق میدهد.
- این امر استفاده کارآمد از منابع را تضمین میکند و انتقال داده بین دستگاهها را به حداقل میرساند.
-
تعادل بار در زمان اجرا:
- لینگوا لینکد عملکرد دستگاهها را به طور فعال نظارت میکند و وظایف را برای جلوگیری از گلوگاهها مجدداً توزیع میکند.
- این رویکرد پویا استفاده کارآمد از تمام منابع موجود را تضمین میکند و پاسخگویی کلی سیستم را بهبود میبخشد.
-
ارتباط بهینهسازیشده:
- نقشههای انتقال داده کارآمد جریان اطلاعات بین دستگاهها را هدایت میکنند و یکپارچگی ساختاری مدل را حفظ میکنند.
- این روش تأخیر را کاهش میدهد و پردازش به موقع دادهها را در سراسر شبکه دستگاههای موبایل تضمین میکند.

یک مدل زبانی بزرگ (LLM) به بخشهای مختلف (یا قطعات) تقسیم میشود و در چندین دستگاه موبایل توزیع میشود. این رویکرد به هر دستگاه اجازه میدهد تا تنها بخشی از نیازهای محاسباتی و ذخیرهسازی کل را مدیریت کند، که اجرای مدلهای پیچیده حتی بر روی دستگاههای با منابع محدود را ممکن میسازد. در اینجا یک تجزیه و تحلیل از نحوه کار این روش آورده شده است:
تقسیمبندی و توزیع مدل
- تقسیمبندی مدل:
- مدل زبانی بزرگ به یک گراف محاسباتی تبدیل میشود که در آن هر عملیات در شبکه به عنوان یک گره نمایش داده میشود.