Yandex тил моделларини сиқишнинг янги усулларини ишлаб чиқди
Янги усуллар ёрдамида жавоблар сифатини 95 фоизга сақлаб қолган ҳолда модел ҳажмини 8 баробарга қисқартириш мумкин.
Усул иккита воситани ўз ичига олади: биринчиси нейрон тармоқларни сиқиб чиқаради, иккинчиси эса моделни қисқартириш жараёнида юзага келадиган хатоларни тузатади.
Ечим зарур жиҳозлар нархини 8 баробаргача камайтириш ва нейрон тармоқларни камроқ ҳисоблаш қувватига эга қурилмаларда ишга тушириш имконини беради.
Айтганча, нейрон тармоғини сиқиш усуллари аллақачон фойдаланиш учун мавжуд - код GitHubда нашр этилган.
Изоҳ қолдириш учун сайтда рўйхатдан ўтинг
Кириш
Ижтимоий тармоқлар орқали киринг
FacebookTwitter