AI, FSD, and working with The Technoking

IA, FSD et collaboration avec The Technoking

Cette semaine, le directeur de l'intelligence artificielle de Tesla, Andrej Karpathy , a été interviewé sur le podcast The Robot Brains . Nous avons résumé les éléments clés de l'interview d'une heure où le directeur de l'IA partage ses idées sur l'IA et ce que c'est que de travailler avec The Technoking .

Avant de rejoindre Tesla, Andre travaillait dans le domaine de l'éducation et de la recherche en se concentrant sur l'intelligence artificielle et l'apprentissage en profondeur. Il a enseigné à Stanford en donnant des cours d'apprentissage en profondeur, qui était le premier du genre. Il a également obtenu son doctorat. là-bas avant de rejoindre OpenAI en tant que chercheur scientifique lisant et écrivant des articles.

REJOINDRE TESLA

Alors, comment Elon Musk et Andrej Karpathy se sont-ils croisés ?

Andrej dit :

«Je devenais définitivement un peu agité à ce moment-là [at OpenAI]. J'avais l'impression que ces algorithmes sont extrêmement puissants et peuvent vraiment faire avancer l'aiguille sur certains problèmes très, incroyablement importants dans la société. Je voulais jouer un rôle plus actif à cet égard. Je cherchais différentes opportunités, des start-ups et des choses comme ça.

Et puis une chose qui s'est en quelque sorte produite sur le côté, c'est parce qu'OpenAI, à l'époque sous l'égide des organisations Elon, nous interagissions avec des gens de Tesla et je consultais un peu pour certains des problèmes sur le pilote automatique .

Elon a tendu la main et m'a demandé : « Hé, vous avez été en quelque sorte consultant pour l'équipe. Voulez-vous réellement rejoindre et diriger l'équipe de vision par ordinateur ici et aider à faire rouler cette voiture ? Et donc, il m'a attrapé au bon moment. Cela a été une opportunité incroyablement percutante. Et j'aime la compagnie. Et bien sûr, j'aime Elon et tout ce qu'il fait. Et donc, je dirais que, encore une fois, ce fut un moment où les étoiles se sont alignées pour moi.

TRAVAILLER AVEC ELON MUSK

En tant que cadre supérieur qui travaille en étroite collaboration avec The Technoking, à quoi ressemble vraiment Musk en tant que patron ?

Andrej dit :

"C'est une épée à double tranchant en termes de travail avec lui car il veut l'avenir hier. Et il va pousser les gens et il va injecter beaucoup d'énergie et il veut que ça se fasse vite. Et vous devez avoir une certaine attitude, je pense, pour vraiment tolérer cela sur de longues périodes. Mais il s'entoure de gens qui en tirent de l'énergie et qui veulent aussi que l'avenir se produise plus rapidement. Ces gens s'épanouissent vraiment chez Tesla.

QU'EST-CE QUE L'APPRENTISSAGE EN PROFONDEUR ?

C'est un sujet très complexe, mais Andrej a utilisé l'exemple de la reconnaissance d'images pour l'expliquer du mieux qu'il pouvait.

« Les images sont constituées d'un grand nombre de pixels sur un ordinateur, et chaque pixel vous indique simplement la luminosité du canal rouge, vert et bleu à ce point. Et donc vous avez un large éventail de nombres et vous devez passer de cela à, hé, c'est un chat ou un chien. Un logiciel conventionnel typique est écrit par une personne, un programmeur, écrivant une série d'instructions pour aller de l'entrée à la sortie. Donc, dans ce cas, vous voulez que quelqu'un écrive un programme sur la façon dont vous combinez ces millions de valeurs de pixels qui définissent s'il s'agit d'un chat ou d'un chien.

Il s'avère que personne ne peut écrire ce programme. C'est un programme très compliqué car il y a une énorme variabilité dans l'apparence d'un chat ou d'un chien. Ainsi, nous apprenons en profondeur. L'apprentissage en profondeur est une classe de programmation différente. Nous organisons un grand ensemble de données d'images possibles et les étiquettes souhaitées doivent sortir de l'algorithme. Nous mesurons les performances d'un algorithme. Et ensuite, en gros, ce que nous faisons, c'est mettre en place un réseau de neurones. C'est un tas de neurones connectés les uns aux autres avec certaines forces, et vous leur fournissez des images et ils essaient de prédire ce qu'ils contiennent. Et c'est là qu'intervient l'apprentissage. L'étiquetage des données est la façon dont Tesla, ou je suppose que quiconque fait de la reconnaissance d'images, établit cette vérité de base, sur laquelle les algorithmes peuvent ensuite être affinés.

Le réseau neuronal regarde l'image, vous donne une prédiction, puis vous mesurez l'erreur. OK, vous avez dit que c'est un chat, mais en fait c'est un chien. Et il existe une procédure mathématique pour régler les cordes afin que le réseau de neurones s'adapte à vous. L'apprentissage en profondeur est essentiellement un paradigme de programmation logicielle différent dans lequel nous spécifions ce que nous voulons, puis nous utilisons une sorte de mathématiques et d'algorithmes pour régler le système. Quant à la manière dont Tesla gère spécifiquement ce processus d'apprentissage, Tesla collecte ces données et de différentes manières. Le premier ici étant très évident. S'il y a une intervention lorsque le pilote automatique est activé, cela peut être une excellente source de données pour Tesla. Tesla peut isoler les incidents et les événements, les extraire de la flotte, les étiqueter, puis recycler le réseau sur eux.

Ce que Tesla veut faire et essaie de faire, c'est d'automatiser autant de choses que possible. C'est là qu'intervient le projet Dojo , appelé en plaisantant Operation Vacation, car s'il fonctionne, ils peuvent presque partir en vacances et le système s'améliorera beaucoup avec le temps."

Depuis le déploiement de la première version bêta de FSD , Tesla a collecté encore plus de données. Au fur et à mesure que le temps passe et que le système s'améliore, la qualité de ces données va également s'améliorer. Ainsi, avec toutes ces choses alignées, il est facile de voir à quel point les progrès vont être exponentiels.