En savoir plus sur l’IA avec Andrew Ng, fondateur de Google Brain et Landing AI


Andrew Ng a porté de nombreux chapeaux dans sa vie. Vous le connaissez peut-être comme le fondateur de la L’équipe Google Brain ou l’ancien scientifique en chef de Baidu. Vous pouvez également le connaître comme votre propre instructeur. Il a enseigné à d’innombrables étudiants, auditeurs curieux et chefs d’entreprise les principes de l’apprentissage automatique grâce à ses cours en ligne très populaires.

Maintenant dans sa dernière aventure, Atterrissage AI, qu’il a commencé en 2017, il explore comment les entreprises sans ensembles de données géants sur lesquels s’appuyer peuvent encore participer à la révolution de l’IA.

Le 23 mars, Ng a rejoint le virtuel EmTech Digital du MIT Technology Review, notre événement annuel sur l’IA, pour partager les leçons qu’il a apprises.

Cette interview a été condensée et légèrement modifiée pour plus de clarté.

MIT Technology Review: je suis sûr que les gens vous demandent souvent: «Comment créer une entreprise axée sur l’IA?» Qu’est-ce que vous en dites habituellement?

Andrew Ng: Je dis généralement: “Ne faites pas ça.” Si je vais dans une équipe et dis: «Hé, tout le monde, s’il vous plaît, soyez AI d’abord», cela tend à concentrer l’équipe sur la technologie, ce qui pourrait être formidable pour un laboratoire de recherche. Mais en ce qui concerne la façon dont j’exécute l’entreprise, j’ai tendance à être dirigée par le client ou par la mission, presque jamais par la technologie.

Vous avez maintenant cette nouvelle entreprise appelée Landing AI. Pouvez-vous nous en dire un peu plus sur ce que c’est et pourquoi vous avez choisi d’y travailler?

Après avoir dirigé les équipes d’IA chez Google et Baidu, j’ai réalisé que l’IA avait transformé l’internet grand public de logiciels, comme la recherche sur le Web et la publicité en ligne. Mais je voulais amener l’IA dans toutes les autres industries, qui représentent une part encore plus importante de l’économie. Donc, après avoir examiné de nombreuses industries différentes, j’ai décidé de me concentrer sur la fabrication. Je pense que plusieurs industries sont prêtes pour l’IA, mais l’un des modèles pour qu’une industrie soit plus prête pour l’IA est si elle a subi une transformation numérique, donc il y a des données. Cela crée une opportunité pour les équipes d’IA de venir utiliser les données pour créer de la valeur.

Donc, l’un des projets qui m’enthousiasme récemment est la fabrication de l’inspection visuelle. Pouvez-vous regarder une photo d’un smartphone sortant de la chaîne de fabrication et voir s’il y a un défaut? Ou regardez un composant automobile et voyez s’il y a une entaille? Une énorme différence réside dans l’internet des logiciels grand public, vous avez peut-être un milliard d’utilisateurs et une énorme quantité de données. Mais dans la fabrication, aucune usine n’a fabriqué un milliard, voire un million de smartphones rayés. Dieu merci pour cela. Le défi est donc de faire en sorte qu’une IA fonctionne avec une centaine d’images? Il s’avère souvent que vous le pouvez. En fait, j’ai été souvent surpris de tout ce que vous pouvez faire avec des quantités de données, même modestes. Et donc, même si tout le battage médiatique, l’excitation et les relations publiques autour de l’IA se trouvent sur les ensembles de données géants, je pense qu’il y a beaucoup de place dont nous avons besoin pour grandir également pour ouvrir ces autres applications où les défis sont assez différents.

Comment tu fais ça?

Une erreur très fréquente que je vois faire des PDG et des DSI: ils me disent quelque chose comme «Hé, Andrew, nous n’avons pas beaucoup de données – mes données sont en désordre. Alors donnez-moi deux ans pour construire une excellente infrastructure informatique. Ensuite, nous aurons toutes ces excellentes données sur lesquelles construire l’IA. ” Je dis toujours: «C’est une erreur. Ne fais pas ça. Premièrement, je ne pense pas qu’aucune entreprise sur la planète aujourd’hui – peut-être même pas les géants de la technologie – pense que ses données sont parfaitement propres et parfaites. C’est un voyage. Passer deux ou trois ans pour construire une belle infrastructure de données signifie que vous manquez de commentaires de la part de l’équipe d’IA pour vous aider à hiérarchiser l’infrastructure informatique à construire.

Par exemple, si vous avez beaucoup d’utilisateurs, devriez-vous prioriser leur poser des questions dans une enquête pour obtenir un peu plus de données? Ou dans une usine, devriez-vous donner la priorité à la mise à niveau du capteur de quelque chose qui enregistre les vibrations 10 fois par seconde à peut-être 100 fois par seconde? Il commence souvent à faire un projet d’IA avec les données que vous avez déjà qui permettent à une équipe d’IA de vous donner les commentaires nécessaires pour vous aider à hiérarchiser les données supplémentaires à collecter.

Dans les industries où nous n’avons tout simplement pas l’échelle de l’internet logiciel grand public, je pense que nous devons changer d’état d’esprit gros données à bon Les données. Si vous avez un million d’images, allez-y, utilisez-le – c’est génial. Mais il y a beaucoup de problèmes qui peuvent utiliser des ensembles de données beaucoup plus petits qui sont proprement étiquetés et soigneusement organisés.

Pouvez-vous donner un exemple? Qu’entendez-vous par de bonnes données?

Permettez-moi d’abord de donner un exemple de la reconnaissance vocale. Lorsque je travaillais avec la recherche vocale, vous obteniez des extraits audio dans lesquels vous entendiez quelqu’un dire: «Hum, la météo d’aujourd’hui». La question est, quelle est la bonne transcription pour ce clip audio? Est-ce «Um (virgule) le temps d’aujourd’hui», ou est-ce «Um (point, point, point) le temps d’aujourd’hui», ou est-ce que «Um» est quelque chose que nous ne transcrivons tout simplement pas? Il s’avère que n’importe lequel de ces éléments est correct, mais ce qui ne l’est pas, c’est que différents transcripteurs utilisent chacune des trois conventions d’étiquetage. Ensuite, vos données sont bruyantes et cela nuit au système de reconnaissance vocale. Désormais, lorsque vous avez des millions ou un milliard d’utilisateurs, vous pouvez avoir ces données bruyantes et faire la moyenne – l’algorithme d’apprentissage fonctionnera bien. Mais si vous vous trouvez dans un environnement où vous disposez d’un ensemble de données plus petit (une centaine d’exemples, par exemple), ce type de données bruyantes a un impact considérable sur les performances.

Autre exemple du secteur manufacturier: nous avons beaucoup travaillé sur l’inspection de l’acier. Si vous conduisez une voiture, le côté de votre voiture était autrefois fait d’une tôle d’acier. Parfois, il y a de petites rides dans l’acier, ou de petites bosses ou des taches dessus. Vous pouvez donc utiliser une caméra et une vision par ordinateur pour voir s’il y a des défauts ou non. Mais différents étiqueteurs étiqueteront les données différemment. Certains mettront une boîte englobante géante dans toute la région. Certains mettront de petites boîtes englobantes autour des petites particules. Lorsque vous disposez d’un ensemble de données modeste, s’assurer que les différents inspecteurs de la qualité étiquettent les données de manière cohérente – cela s’avère être l’une des choses les plus importantes.

Pour de nombreux projets d’IA, le modèle open source que vous téléchargez depuis GitHub – le réseau neuronal que vous pouvez obtenir dans la littérature – est assez bon. Pas pour tous les problèmes, mais pour les principaux problèmes. Je suis donc allé voir beaucoup de mes équipes et j’ai dit: «Hé, tout le monde, le réseau neuronal est assez bon. Ne gâchons plus le code. La seule chose que vous allez faire maintenant est de créer des processus pour améliorer la qualité des données. » Et il s’avère que cela se traduit souvent par des améliorations plus rapides des performances de l’algorithme.

À quelle taille de données pensez-vous lorsque vous parlez d’ensembles de données plus petits? Parlez-vous d’une centaine d’exemples? Dix exemples?

L’apprentissage automatique est si diversifié qu’il est devenu très difficile de donner des réponses universelles. J’ai travaillé sur des problèmes où j’avais environ 200 à 300 millions d’images. J’ai également travaillé sur des problèmes où j’avais 10 images, et tout le reste. Quand je regarde les applications de fabrication, je pense que quelque chose comme des dizaines ou peut-être une centaine d’images pour une classe de défauts n’est pas inhabituel, mais il y a une très grande variance même au sein de l’usine.

Je trouve que les pratiques d’IA changent lorsque la taille des ensembles d’entraînement passe en dessous, disons, de 10000 exemples, car c’est en quelque sorte le seuil où l’ingénieur peut essentiellement regarder chaque exemple et le concevoir lui-même, puis prendre une décision.

Récemment, je discutais avec un très bon ingénieur dans l’une des grandes entreprises technologiques. Et j’ai demandé: “Hé, que faites-vous si les étiquettes ne sont pas cohérentes?” Et il a dit: «Eh bien, nous avons cette équipe de plusieurs centaines de personnes à l’étranger qui s’occupe de l’étiquetage. J’écrirai donc les instructions d’étiquetage, je demanderai à trois personnes d’étiqueter chaque image, puis je prendrai une moyenne. ” Et j’ai dit: “Oui, c’est la bonne chose à faire lorsque vous avez un ensemble de données géant.” Mais lorsque je travaille avec une petite équipe et que les étiquettes ne sont pas cohérentes, je traque simplement les deux personnes qui ne sont pas d’accord l’une avec l’autre, je les fais tous les deux participer à un appel Zoom et je les fais parler pour essayer de trouver une solution.

Je souhaite maintenant attirer notre attention sur vos réflexions sur l’industrie générale de l’IA. L’algorithme est notre bulletin d’information sur l’IA, et j’ai donné à nos lecteurs l’occasion de vous poser des questions à l’avance. Un lecteur demande: le développement de l’IA semble avoir principalement bifurqué soit vers la recherche universitaire, soit vers des programmes de grande entreprise à grande échelle et gourmands en ressources comme OpenAI et DeepMind. Cela ne laisse pas vraiment beaucoup de place aux petites startups pour y contribuer. Selon vous, quels sont les problèmes pratiques sur lesquels les petites entreprises peuvent vraiment se concentrer pour favoriser une réelle adoption commerciale de l’IA?

Je pense qu’une grande partie de l’attention des médias a tendance à être sur les grandes entreprises, et parfois sur les grandes institutions universitaires. Mais si vous assistez à des conférences universitaires, il y a beaucoup de travail effectué par de petits groupes de recherche et des laboratoires de recherche. Et quand je parle avec différentes personnes dans différentes entreprises et industries, j’ai l’impression qu’il y a tellement d’applications commerciales qu’elles pourraient utiliser l’IA pour lutter contre. Je vais généralement chez les chefs d’entreprise et je leur demande: «Quels sont vos plus gros problèmes commerciaux? Quelles sont les choses qui vous inquiètent le plus? » afin que je puisse mieux comprendre les objectifs de l’entreprise et ensuite réfléchir à la question de savoir s’il existe ou non une solution d’IA. Et parfois il n’y en a pas, et c’est très bien.

Je vais peut-être mentionner quelques lacunes que je trouve intéressantes. Je pense qu’aujourd’hui, la construction de systèmes d’IA est encore très manuelle. Vous avez quelques brillants ingénieurs en apprentissage automatique et scientifiques des données qui font des choses dans un ordinateur, puis poussent les choses vers la production. Il y a beaucoup d’étapes manuelles dans le processus. Je suis donc enthousiasmé par les opérations ML [machine learning operations] en tant que discipline émergente pour aider à rendre le processus de construction et de déploiement de systèmes d’IA plus systématique.

En outre, si vous examinez un grand nombre de problèmes commerciaux typiques – toutes les fonctions du marketing aux talents – il y a beaucoup de place pour l’automatisation et l’amélioration de l’efficacité.

J’espère également que la communauté de l’IA pourra se pencher sur les plus grands problèmes sociaux – voir ce que nous pouvons faire pour lutter contre le changement climatique, l’itinérance ou la pauvreté. En plus des problèmes commerciaux parfois très précieux, nous devons également travailler sur les problèmes sociaux les plus importants.

Comment procédez-vous réellement pour identifier s’il existe une opportunité de poursuivre quelque chose avec l’apprentissage automatique pour votre entreprise?

J’essaierai d’en apprendre un peu plus sur l’entreprise moi-même et j’essaierai d’aider les chefs d’entreprise à en apprendre un peu plus sur l’IA. Ensuite, nous réfléchissons généralement à un ensemble de projets, et pour chacune des idées, je ferai à la fois une diligence technique et une diligence commerciale. Nous allons examiner: Avez-vous suffisamment de données? Quelle est la précision? Y a-t-il une longue traîne lorsque vous déployez en production? Comment remplir les données et fermer la boucle pour un apprentissage continu? Donc – s’assurer que le problème est techniquement réalisable. Et puis la diligence commerciale: nous nous assurons que cela permettra d’atteindre le retour sur investissement que nous espérons. Après ce processus, vous avez l’habituel, comme l’estimation des ressources, les jalons, puis, espérons-le, passer à l’exécution.

Une autre suggestion: il est plus important de commencer rapidement, et c’est normal de commencer petit. Ma première application commerciale significative chez Google a été la reconnaissance vocale, pas la recherche sur le Web ou la publicité. Mais en aidant l’équipe vocale de Google à rendre la reconnaissance vocale plus précise, cela a donné à l’équipe Brain la crédibilité et les moyens de rechercher des partenariats de plus en plus importants. Google Maps était donc le deuxième grand partenariat où nous avons utilisé la vision par ordinateur – pour lire les numéros de maison et géolocaliser les maisons sur Google Maps. Et ce n’est qu’après ces deux premiers projets réussis que j’ai eu une conversation plus sérieuse avec l’équipe de publicité. Je pense donc que je vois plus d’entreprises échouer en commençant trop grand que d’échouer en commençant trop petit. C’est bien de faire un petit projet pour se lancer en tant qu’organisation afin d’apprendre ce que l’on ressent en utilisant l’IA, puis de continuer à créer de plus grands succès.

Quelle est une chose que notre public devrait commencer à faire demain pour mettre en œuvre l’IA dans ses entreprises?

Lancez-vous. L’IA entraîne un changement dans la dynamique de nombreuses industries. Donc, si votre entreprise ne fait pas déjà des investissements assez agressifs et intelligents, c’est le bon moment.

Leave a Reply

Your email address will not be published. Required fields are marked *