
Топикстартер
Член клуба
[Udemy] Квантование для моделей GenAI (Start Tech Academy)
- Ссылка на картинку
Чему Вы научитесь:
Материалы курса:
5 разделов • 24 лекций • Общая продолжительность 2 ч 35 мин
1.Введение
2.Методы оптимизации модели Gen AI
2.1.Введение в модели Gen AI
2.2.Методы оптимизации модели - введение
2.3.Введение в обрезку
2.4.Введение в дистилляцию знаний
2.5.Введение в квантование
3.Типы данных и представление чисел
3.1.Типы данных и представление числа
3.2.Целочисленные типы данных
3.3.Целочисленное типин данных pytorch
3.4.8-битные номера с фиксированной точкой
3.5.Номера с плавающей запятой
3.6.Другие форматы с плавающей точкой
3.7.Типы данных с плавающей запятой в Pytorch
3.8.Другие форматы
4.Квантование
4.1.Уничтожение FP32 до BF16
4.2.Понижение тензоров в питоне
4.3.Понижение модели ML в Python
4.4.Уничтожение FP32 до Int8
4.5.Квантование симметрики
4.6.Квантование асимметрики
4.7.Gpt neo 125 квантование
5.Заключение
- Понимать методы оптимизации моделей: обрезка, дистилляция и квантование
- Изучите основы типов данных, таких как FP32, FP16, BFloat16 и INT8
- Освоите понижение типа FP32 до BF16 и FP32 до INT8
- Изучите разницу между симметричным и асимметричным квантованием
- Реализуете методы квантования в Python с реальными примерами
- Примените квантование, чтобы сделать модели более эффективными и готовыми к развертыванию
- Приобретите практические навыки оптимизации моделей для периферийных устройств и сред с ограниченными ресурсами
Материалы курса:
5 разделов • 24 лекций • Общая продолжительность 2 ч 35 мин
1.Введение
2.Методы оптимизации модели Gen AI
2.1.Введение в модели Gen AI
2.2.Методы оптимизации модели - введение
2.3.Введение в обрезку
2.4.Введение в дистилляцию знаний
2.5.Введение в квантование
3.Типы данных и представление чисел
3.1.Типы данных и представление числа
3.2.Целочисленные типы данных
3.3.Целочисленное типин данных pytorch
3.4.8-битные номера с фиксированной точкой
3.5.Номера с плавающей запятой
3.6.Другие форматы с плавающей точкой
3.7.Типы данных с плавающей запятой в Pytorch
3.8.Другие форматы
4.Квантование
4.1.Уничтожение FP32 до BF16
4.2.Понижение тензоров в питоне
4.3.Понижение модели ML в Python
4.4.Уничтожение FP32 до Int8
4.5.Квантование симметрики
4.6.Квантование асимметрики
4.7.Gpt neo 125 квантование
5.Заключение
Показать больше
Зарегистрируйтесь
, чтобы посмотреть авторский контент.