![]()

ALBERT Pompe hydraulique ABT1-55-4R02-Z11 ALBERT ABT1-25-1R00-B10E ABT1-55-2R02-C1 pompe à palettes servopompe hydraulique.L'augmentation de la taille du modèle lors de la pré-formation des représentations en langage naturel se traduit souvent par une amélioration des performances sur les tâches en aval. Cependant, à un moment donné, d'autres augmentations de modèle deviennent plus difficiles en raison des limitations de mémoire GPU/TPU et temps de formation plus longs. Pour résoudre ces problèmes, nous présentons deux techniques de réduction de paramètres pour réduire la consommation de mémoire et augmenter la formation vitesse du BERT (Devlin et al., 2019). Des preuves empiriques complètes montrent que nos méthodes proposées conduisent à des modèles qui évoluent beaucoup mieux par rapport à le BERT d'origine. Nous utilisons également une perte auto-supervisée qui se concentre sur la modélisation cohérence inter-phrases, et montrer qu'il aide systématiquement les tâches en aval avec entrées multi-phrases. En conséquence, notre meilleur modèle établit un nouvel état de l'art résultats sur les benchmarks GLUE, RACE et SQuAD tout en ayant moins de paramètres par rapport à BERT-large. Le code et les modèles pré-entraînés sont disponibles |



![]()

![]()

![]()

















