SantaCoder – ein Codegenerierungsmodell, trainiert mit 1,1 Milliarden (1.1B) Parametern
(huggingface.co)- Ein mehrsprachiges Sprachmodell, das mit Python-, Java- und Javascript-Code trainiert wurde
- Bei LTR-Generierung und Infilling soll es besser sein als Facebooks InCoder (6.7B) und Salesforces CodeGen-Multi (2.7B)
- Verwendet einen Teil des von BigCode veröffentlichten Datensatzes The-Stack v1.1 (6TB)
2 Kommentare
Im Moment pushen AI-Projekte mit der schieren Leistung ihrer Parameter extrem nach vorn, aber ich frage mich, wie die Preise angesetzt sein müssten, um die Rentabilität zu sichern. Ob sich die Kosten wie bei CoPilot mit 10 $ im Monat wirklich decken lassen ... (Auch wenn ich weiß, dass es sinnlos ist, sich um Großkonzerne Sorgen zu machen ...)
GitHubs Copilot hat 12B, daher heißt es, dass es bei der Qualität des erzeugten Codes durchaus Unterschiede dazu gibt.