Comme toutes les années, l’évènement annuel dédié au cloud computing “AWS” a été organisé par Amazon. Lors de ce meeting, le géant du e-commerce a dévoilé sa nouvelle puce baptisée “Trainium”. Cette dernière a pour but d’améliorer l’entrainement des modèles de Machine Learning et d’intelligence artificielle dans le cloud.
Trainium est une puce qui a été conçu en interne par Amazon
C’est avec ses propres équipes et moyens qu’Amazon a développé ce nouveau bijou technologique. Cette puce permettra à Amazon de pouvoir se démarquer de la concurrence , la société affirmant que son produit est celui qui délivre le plus de téraflops sur le marché actuel.
En outre, elle promet des débits 30% supérieurs et des coûts d’inférence 45% inférieurs aux instances AWS équivalentes basées sur des GPU. La bande passante disponible sera donc beaucoup plus importante, avec un coût moindre.
La nouvelle puce Trainium d’Amazon sera commercialisée au second semestre 2021. Elle pourra prendre en charge les frameworks les plus classiques comme le tensorflow (Google), PyTorch (Facebook) mais aussi MXnet.
Le même SDK Neuron que sa puce Inférentia
Amazon avait, précédemment, développé une puce similaire, nommée Inférentia. Trainium utilise donc une technologie similaire à celle-ci. Et, la puce de dernière génération remplacera les processeurs Nvidia pour ce qui concerne l’inférence. Cette technologie est d’ailleurs utilisée et déployée dans de nombreux produits, comme par exemple l’assistant vocal “Alexa”, mais aussi Rekognition, son logiciel de reconnaissance faciale.
La nouvelle puce Trainium sera en concurrence directe avec les TPU développés par Google, qu’elle utilise pour sa plateforme Cloud. Amazon a encore d’autres projets de développement en cours, notamment dans les cartons la disponibilité d’instances EC2, basées sur les puces Habana Gaudi d’Intel.
Yvan Dupuy