社会

Avec Brain.ai, l'IA générative est le système d'exploitation

Le stylo Humane Ai Pin et le lapin handheld ont attiré beaucoup d'intérêt de la presse pour leurs approches individuelles intégrant l'IA générative avec du matériel. Humane, en particulier, présente son portable comme un aperçu de la vie au-delà du smartphone. Cela pose naturellement la question: qu'est-ce qui ne va pas précisément avec le smartphone? Bien que la forme ait atteint un plateau, ces appareils sont toujours présents dans le monde, entre les mains de milliards de personnes.

Plus tôt cette semaine, j'ai rencontré Jerry Yue au milieu du brouhaha du stand du Mobile World Congress de Deutsch Telekom. Après une démonstration de produit et une conversation, je dois admettre que je suis impressionné par la vision de l'avenir des smartphones du fondateur et PDG de Brain.ai (également connu sous le nom de Brain Technologies). Je n'irai pas jusqu'à dire que je suis entièrement convaincu jusqu'à ce que j'aie eu l'occasion de passer plus de temps avec le produit, mais il peint absolument un tableau convaincant de la façon dont l'IA générative pourrait être fondamentale pour la prochaine génération d'appareils.

Toute cette histoire de "l'avenir des smartphones" peut être hyperbolique, mais au moins, je soupçonne que certains des plus grands noms de l'industrie étudient actuellement la manière dont l'IA générative interne à la première partie forme efficacement l'épine dorsale du système d'exploitation du produit. Mais alors que les sociétés de téléphonie peuvent voir l'avenir, l'interface peut s'avérer plus floue pour les consommateurs. L'implémentation renverse le paradigme actuel du système d'exploitation des smartphones, nécessitant une démo pour comprendre pleinement en quoi il est différent et pourquoi il est utile. Même si j'avoue que je n'étais pas complètement convaincu par l'argumentaire, le voir en action met en lumière son efficacité.

Le système d'exploitation n'est pas complètement déconnecté du système d'exploitation ouvert de Google, mais seulement dans le sens où il est construit sur le noyau Android. Comme nous l'avons vu avec le développement de l'ère Trump de HarmonyOS de Huawei, il est tout à fait possible de créer quelque chose de distinct d'Android en utilisant cela comme base. Ici, l'IA générative est plus qu'intégrée dans le système, elle est le fondement de la façon dont vous interagissez avec l'appareil, de la manière dont il répond et de l'interface qu'il construit.

L'idée d'un "téléphone AI" n'est pas entièrement nouvelle. En fait, c'est une phrase que vous allez beaucoup entendre dans les années à venir. Je vous garantis que vous en aurez marre d'ici décembre. Des éléments d'IA/ML ont été intégrés dans les appareils sous une forme ou une autre depuis plusieurs années maintenant. Entre autres, la technologie est fondamentale pour la photographie computationnelle - c'est le traitement des données collectées par le capteur de la caméra qui se déroule sur la puce.

Cependant, plus tôt ce mois-ci, Samsung est devenu l'une des premières grandes sociétés à vraiment s'engager dans l'idée d'un "téléphone AI". La distinction ici est l'arrivée de l'IA générative - la technologie derrière des programmes comme Google Gemini et ChatGPT. Encore une fois, une grande partie de l'intégration se fait du côté de l'imagerie, mais elle commence à filtrer dans d'autres aspects également.

Crédits image : Brian Heater

Compte tenu de l'importance de l'investissement que Google a consenti dans Gemini, il est logique que cette tendance ne fasse que s'intensifier au cours des prochaines années. Apple, également, entrera dans la catégorie à un moment donné plus tard cette année. Je ne classerais pas encore l'IA générative comme un changement de jeu complet sur ces appareils, mais il est clair que les entreprises qui ne l'embrassent pas maintenant seront laissées pour compte dans les années à venir.

L'utilisation de la technologie par Brain.ai va beaucoup plus loin que d'autres implémentations actuelles. Du point de vue du matériel, cependant, c'est un smartphone standard. En fait, l'accord avec Deutsch Telecom qui a conduit Yue à exposer dans le stand dominé par le magenta signifie que le système d'exploitation verra le jour initialement via l'appareil connu sous le nom de T-Mobile REVVL ici aux États-Unis (connu sous le nom de "T Phone" sur les marchés internationaux comme l'UE). Le modèle précis, la date de sortie et la nature de l'accord seront révélés "bientôt", selon Yue.

Cependant, la vérité est que l'interface de Brain est conçue pour être indépendante du matériel, s'adaptant à la forme sur laquelle elle est exécutée. Cela ne signifie pas que le matériel n'est pas important, bien sûr. Au cœur, le T-Mobile REVVL Plus, par exemple, est un téléphone économique, vendu à environ 200 $. Ce n'est pas un produit phare, mais il vous donne un bon rapport qualité-prix, y compris un processeur Snapdragon 625 et un double appareil photo arrière de 13 et 15 mégapixels, respectivement. Bien que 2 Go de RAM ne soient pas beaucoup, Yue insiste sur le fait que le système d'exploitation de Brain.ai peut en faire plus avec moins. De plus, encore une fois, nous ne savons pas quels spécifications spécifiques aura l'appareil au lancement.

L'interface commence par un écran statique. À partir de là, vous lancez des requêtes avec une commande vocale ou textuelle. Dans un exemple, Yue demande au système de "recommander un cadeau pour ma grand-mère, qui ne peut pas sortir du lit." À partir de là, Brain se met au travail en affichant non pas la réponse à la requête, mais une interface spécifique à celle-ci - dans ce cas, il s'agit de résultats de commerce électronique agrégés. La page résultante est épurée du point de vue du design - du texte noir sur un fond blanc. Les phrases alternent avec des boîtes présentant des résultats (dans ce cas, des couvertures et des Kindles).

La requête se trouve en haut. Comme beaucoup d'éléments de l'interface, celle-ci est interactive. Dans ce cas, vous pouvez appuyer pour modifier la recherche. En tapant sur une image, en revanche, vous pouvez l'ajouter à un panier d'achat pour le site de commerce électronique tiers, et vous pouvez passer à la caisse à partir de là. Je devrais noter que tous les résultats de la démo ont été directement extraits d'Amazon. Yue affirme que le système tirera des données de quelque 7 000 sites de vente au lancement, et vous pouvez prioriser les résultats en fonction de critères tels que les détaillants et la taille de l'entreprise (si vous préférez soutenir de plus petites entreprises).

Crédits image : Brian Heater

Les achats sont le premier exemple que Yue me montre, et bon nombre des principes de base s'appliquent de manière générale. Il y a certainement une cohérence de design à travers les fonctionnalités. Cela s'explique en grande partie par le fait que l'appareil est en fait dépourvu d'applications tierces. Cela représente un changement majeur par rapport au paysage actuel des smartphones des 15 dernières années.

"Du point de vue de la confidentialité et de la sécurité, nous voulons offrir un nouveau niveau de contrôle que les gens n'ont pas actuellement", explique Yue. "La compréhension de l'ordinateur de vous, maintenant elle est agrégée dans différentes applications. Ces modèles d'IA sont des boîtes noires - des machines de recommandation qui exploitent notre attention. Nous croyons en l'IA explicable. Nous vous expliquerons à chaque étape pourquoi nous faisons une recommandation. Vous avez plus de gens possédant l'IA et pas de boîtes noires de grandes technologies."

L'adaptabilité est un autre grand argument de vente. Le modèle améliore les recommandations et se personnalise davantage pour l'utilisateur à mesure que les requêtes sont exécutées et modifiées. Bien sûr, les tiers étaient la principale raison pour laquelle les magasins d'applications ont révolutionné l'industrie. Soudain, vous êtes passé d'une seule entreprise créant toutes les expériences de votre téléphone à un système qui exploite l'intelligence et la créativité de nombreux développeurs. L'expérience de Brain sera une combinaison de ce que son équipe de 100 personnes peut produire et de ce que le modèle d'IA peut imaginer. À mesure que le modèle s'améliore, sa fonctionnalité s'améliorera également. Brain.ai s'appuie sur son propre modèle pour l'interface principale, mais tirera des données de tiers comme OpenAI et Google lorsqu'il déterminera qu'ils sont mieux équipés pour répondre à une requête spécifique.

Crédits image : Brian Heater

Il y a des limitations à ce que l'on peut découvrir dans une démonstration comme celle-ci, donc, comme pour de nombreux autres éléments, je vais devoir attendre d'avoir un produit expédié entre les mains pour vraiment évaluer l'expérience. Je suis particulièrement intéressé par la manière dont il gère certaines applications, comme l'imagerie. Il convient de noter que la gamme REVVL n'est pas dotée de très bonnes caméras, donc à moins d'une grande amélioration, ce ne sera pas l'appareil pour ceux qui donnent la priorité aux photos/vidéos.

La caméra jouera également un rôle important dans la recherche. Un exemple que nous avons discuté est de prendre une photo d'un menu dans un pays étranger. Non seulement il traduira (à la manière de Google Lens), mais il offrira également des recommandations alimentaires en fonction de vos goûts. Yue a également brièvement démontré la génération d'image du système avec une requête simple convenant à notre environnement : fabriquer des baskets magenta. Il l'a fait rapidement, avec le seul véritable goulot d'étranglement étant les vitesses de connexion du centre de congrès (ironique, compte tenu des paramètres).

La connectivité est très importante ici. Le traitement de l'IA est effectué hors de l'appareil. J'ai discuté de la possibilité d'ajouter un traitement sur l'appareil, mais Yue n'a pas pu confirmer à quoi cela pourrait ressembler au lancement. Je n'ai pas non plus reçu une réponse entièrement claire pour l'expérience hors ligne. Je soupçonne qu'une grande partie de la raison pour laquelle Deutsch Telekom est si intéressé par le produit est qu'il est un produit qui ne pourrait pas exister de la même manière sans 5G. Cela rappelle l'ill-fated Firefox OS de Mozilla et les premiers jours du Chrome OS, ou tout autre nombre d'exemples d'un produit qui perd une fonctionnalité significative lorsqu'il est hors ligne.

Crédits image : Brian Heater

Yue a fondé Brain en 2015, et est resté son seul employé jusqu'à l'embauche d'un CTO l'année suivante (Yue reste le seul fondateur). Né en Chine, il s'est d'abord intéressé à la technologie à travers son amour pour la robotique et sa participation au tournoi de robotique de soccer RoboCup. À 18 ans, il a fondé l'application sociale chinoise Friendoc. Deux ans plus tard, il a co-fondé Benlai.com, qui est aujourd'hui l'une des plus grandes applications de livraison de nourriture du pays. Yue est depuis retourné dans la région de la baie pour diriger Brain.ai à plein temps. À ce jour, l'entreprise a levé 80 millions de dollars.

Après près d'une décennie, l'interface de Brain est presque prête à être lancée - et elle arrive au moment parfait. L'air du temps est très axé sur la manière dont l'IA générative qui alimente l'expérience, des appareils autonomes comme Rabbit et le Humane Ai Pin aux géants de la technologie comme Samsung qui présente ses propres "téléphones IA".

Related Articles

Back to top button Back to top button