اگر بهعنوان یک توسعهدهنده اندروید به دنبال پیادهسازی تایپ کشویی هستید، دیگر مجبور نیستید دادههای کاربران را به ابر بفرستید تا به دقتی قابلقبول برسید. FUTO Swipe با نرخ خطای تنها ۴٪ در چهار گزینه نخست، دقتی در سطح کیبوردهای شرکتهای بزرگ ارائه میدهد در حالی که تمام پردازشها کاملاً آفلاین رخ میدهد.
برای سالها، تایپ کشوییباکیفیت مانند یک باغ محصور بود و کاربران مجبور بودند برای دسترسی به الگوریتمهای دقیق، حریمخصوصیت خود را فدای اکوسیستمهای شرکتی کنند. FUTO اکنون این الگو را با انتشار مدلها و موتور استنتاج (Inference) — که شبیه به لحظه آشپزی واقعی است نه دورهی آموزش آشپز — برای جامعه متنباز میشکند.
همانطور که در تحلیل قبلی ما دربارهی رایانش لبه اشاره کردیم، انتقال پردازش به دستگاه کاربر کلید حفظ حریمخصوصیت است. طبق مستندات فنی منتشرشده در ۲۳ ژوئن ۲۰۲۶ در وبسایت swipe.futo.tech، این سامانه از یک معماری سهلایه بهره میبرد:
- مدل رمزگذار (Encoder): یک مدل جامع و مستقل از چیدمان برای پیشبینیهای کلی (۶۳۵,۱۴۰ پارامتر).
- ContextLM: یک مدل زبانی کوچک (SLM) — مثل کتابخانهداری که فقط روی یک موضوع خاص تخصص دارد — با ۱.۵ میلیون پارامتر که کلمات بیمعنی را بر اساس جریان جمله حذف میکند.
- رمزگشای (Decoder): مدلی مختص زبان و چیدمان که جزئیات QWERTY انگلیسی را مدیریت میکند (۳۰۴,۱۵۵ پارامتر).
بر اساس گزارشهای تیم توسعه، برای آموزش این مدلها، از اوت ۲۰۲۴ یک کمپین جمعآوری داده در swipe.futo.org آغاز شد. آنها بیش از یک میلیون نمونه تایپ کشویی داوطلبانه از جملات ویکیپدیا جمعآوری کردند که این مجموعه داده در مارس ۲۰۲۵ تحت مجوز MIT در HuggingFace منتشر شد. این تلاش برای بهبود دقت، در راستای رویکردهایی است که پلتفرمهایی مانند TypeForge برای شناسایی و رفع دقیق نقاط ضعف تایپی به کار میگیرند.
بهینه بودن، هسته اصلی این طراحی است. کل سیستم تنها از ۲,۴۹۴,۷۶۷ پارامتر استفاده میکند و در لحظه استنتاج، فقط ۱,۳۶۴,۲۷۱ پارامتر فعال هستند. این اثرپای (Footprint) کوچک باعث میشود مدلها حتی روی سختافزارهای ضعیف در چند میلیثانیه اجرا شوند. جالب این است که کل فرآیند آموزش تنها با یک واحد پردازش گرافیکی (GPU) در یک ایستگاه کاری انجام شده است.
برای کاربردی کردن این مدلها، FUTO کتابخانه swipe-library را با مجوز GPL منتشر کرد. این کتابخانه عملیات جستوجوی پرتویی (Beam Search) و رمزگشایی لازم برای تبدیل مسیر کشویی به کلمه را مدیریت میکند.
این انتشار، توازن قدرت را برای توسعهدهندگان اندروید تغییر میدهد. شما دیگر نیازی ندارید یک خط لوله یادماشینی پیچیده را از صفر بسازید یا برای داشتن یک تایپ کشویی حرفهای، به شخص ثالثی که تشنهی داده است متکل شوید.
با باز کردن دادهها و رمزگشای مدل، FUTO عملاً قابلیتی را که پیشتر تمایز اصلی Gboard یا SwiftKey بود، به یک کالای عمومی (Commodity) تبدیل کرد. توسعهدهندگانی که به دنبال روشهای ورودی اولویت-حریمخصوصی هستند، اکنون میتوانند مدلها را دانلود کرده و کتابخانه C++ را در اپلیکیشنهای اندرویدی خود ادغام کنند.
گام بعدی شما
- اگر اپلیکیشن اندرویدی توسعه میدهید، کتابخانه swipe-library را در محیط توسعه خود تست کنید.
- مجموعه دادههای منتشرشده در HuggingFace را برای بررسی کیفیت دادههای آموزشی مدلهای لبه تحلیل کنید.
- اثر حذف وابستگی به APIهای ابری روی تأخیر (Latency) تایپ را در دستگاههای میانرده بسنجید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ به تحلیل ما دربارهی بهینهسازی مدلهای کوچک در پردازندههای ARM مراجعه کنید.




گفتگو