Supermaven, l'assistant de codage IA, lève des fonds auprès des cofondateurs d'OpenAI et de Perplexity


Jacob Jackson s’est lancé à fond dans l’IA dès le début de sa carrière.

Jackson a cofondé Tabninel'assistant de codage IA qui a récolté près de 60 millions de dollars de financement par capital-risque, alors qu'il était encore étudiant en informatique à l'Université de Waterloo. Après avoir vendu Tabnine à Codata en 2019 (pendant ses examens finaux), Jackson a rejoint OpenAI en tant que stagiaire, où il a travaillé jusqu'en 2022.

C'est à ce moment-là que Jackson a eu l'envie de créer à nouveau une entreprise, axée sur la prise en charge des flux de travail courants des développeurs.

« Depuis que j'ai créé Tabnine, des outils comme ChatGPT et Copilote Github « Les outils d’IA ont changé la façon dont les développeurs travaillent », a déclaré Jackson à TechCrunch. « C’est une période vraiment passionnante pour travailler sur des outils de développement, car la technologie sous-jacente s’est beaucoup améliorée depuis que j’ai lancé Tabnine, ce qui a conduit de nombreux autres développeurs à s’intéresser à l’utilisation d’outils d’IA pour accélérer leur flux de travail. »

Alors Jackson a commencé Supermavenune plateforme de codage IA sur le modèle de Tabnine mais avec quelques améliorations de qualité de vie et techniques.

Selon Jackson, Babble, le modèle d'IA générative interne de Supermaven, peut comprendre une grande quantité de code à la fois, grâce à une fenêtre contextuelle d'un million de jetons. (En science des données, les jetons sont des éléments subdivisés de données brutes, comme les syllabes « fan », « tas » et « tic » dans le mot « fantastique »).

Le contexte d'un modèle, ou fenêtre de contexte, fait référence aux données d'entrée (par exemple, le code) que le modèle prend en compte avant de générer une sortie (par exemple, du code supplémentaire). Un contexte long peut empêcher les modèles d'« oublier » le contenu des documents et des données récents, de s'écarter du sujet et d'extrapoler de manière erronée.

« Notre grande fenêtre contextuelle permet de réduire la fréquence des hallucinations « parce que cela permet au modèle de tirer des réponses du contexte dans des situations où il devrait autrement deviner », a déclaré Jackson.

Un million de jetons représente en effet une fenêtre contextuelle importante. Mais elle n'est pas plus grande qu'une startup de codage d'IA Magiesoit 100 millions de jetons. Entre-temps, Google a récemment introduit Assistance au code l'outil correspond au contexte de Supermaven à 1 million de jetons.

Alors, quels sont les avantages de Supermaven par rapport à ses concurrents ? Jackson affirme que Babble a une latence plus faible grâce à une « nouvelle architecture neuronale ». Il n’a pas voulu en dire plus, se contentant de dire que l’architecture a été développée « à partir de zéro ».

« Supermaven passe entre 10 et 20 secondes à traiter le référentiel de code d'un développeur pour se familiariser avec ses API et les conventions uniques de sa base de code », a déclaré Jackson. « Avec une latence plus faible grâce à notre infrastructure de mise à disposition de modèles interne, notre outil reste réactif tout en travaillant avec les longues invites qui accompagnent les bases de code volumineuses. »

Le marché des outils de codage d'IA est vaste et en pleine croissance, avec Polaris Research en saillie qu'il vaudra 27,17 milliards de dollars d'ici 2032. grande majorité des personnes interrogées dans le dernier sondage de GitHub auprès des développeurs déclarent avoir adopté des outils d'IA sous une forme ou une autre, et plus de 1,8 million de personnes – et environ 50 000 entreprises – paient pour GitHub Copilot.

Mais Supermaven — tout comme ses concurrents startups comme Cognition, Anysphere, Poolside, Codeium et Augment — ont des défis éthiques et juridiques à surmonter.

Les entreprises hésitent souvent à divulguer leur code propriétaire à un tiers, comme Apple par exemple. apparemment L'année dernière, le personnel de l'entreprise a été interdit d'utiliser Copilot, invoquant des inquiétudes concernant la fuite de données confidentielles. Certains outils de génération de code formés à l'aide de codes sous licence restrictive ou protégés par des droits d'auteur ont été montré de régurgiter ce code lorsqu'on le lui demande d'une certaine manière, ce qui présente un risque de responsabilité (c'est-à-dire que les développeurs qui incorporent le code pourraient être poursuivis). Et, comme l'IA fait des erreurs, les outils de codage d'assistance peuvent entraîner code encore plus erroné et non sécurisé étant poussé vers les bases de code.

Jackson a déclaré que Supermaven n’utilisait pas les données des clients pour entraîner ses modèles. Il a toutefois admis que l’entreprise conservait les données pendant une semaine pour « rendre le système rapide et réactif », a-t-il déclaré. Sur le sujet du droit d’auteur, Jackson n’a pas nié explicitement que Babble ait été formé sur du code protégé par la propriété intellectuelle – seulement qu’il avait été « formé presque exclusivement sur du code disponible publiquement plutôt que sur un extrait de l’Internet public » pour « réduire l’exposition au contenu toxique pendant la formation ».

Les clients ne semblent pas découragés. Plus de 35 000 développeurs utilisent Supermaven, explique Jackson, et une part non négligeable d'entre eux paie pour les abonnements premium Pro (10 $ par mois) et Team (10 $ par mois et par utilisation). Le chiffre d'affaires annuel récurrent de Supermaven a atteint 1 million de dollars cette année grâce à une base d'utilisateurs qui a triplé depuis le lancement de la plateforme en février.

Cet élan a attiré l’attention des capital-risqueurs.

Supermaven a annoncé cette semaine son premier financement externe : un tour de table de 12 millions de dollars mené par Bessemer Venture Partners et des investisseurs providentiels de renom, dont John Schulman, cofondateur d'OpenAI, et Denis Yarats, cofondateur de Perplexity. Jackson explique que le plan est de dépenser l'argent pour embaucher des développeurs (Supermaven dispose actuellement d'une équipe de cinq personnes) et pour développer l'éditeur de texte de Supermaven, qui est actuellement en version bêta.

« Nous prévoyons une croissance significative d’ici la fin de l’année », a-t-il ajouté. « Malgré les vents contraires qui soufflent sur le secteur technologique en général, le marché des copilotes de codage connaît une croissance rapide. Notre croissance depuis notre lancement en février, ainsi que notre dernier tour de financement, nous positionnent bien à l’approche de l’année prochaine. »