De belangrijke update Grok-2 uitgebracht, die verbeterde conversatie-, coderings- en redeneervaardigheden biedt.
Naast Grok-2 heeft xAI ook Grok-2 mini uitgebracht, een verkleinde maar functionele variant van het primaire model. Beide zijn later deze maand toegankelijk via xAI’s enterprise API en zijn al in bèta op X.
xAI claimt op het moment van de aankondiging beter te presteren dan OpenAI’s GPT-4-Turbo en Anthropic’s Claude 3.5 Sonnet. Het is echter belangrijk om op te merken dat GPT-4o momenteel aan de leiding gaat in termen van algemene AI-assistentvaardigheden, met Gemini 1.5 van Google op de tweede plaats.
AI Tutors worden gebruikt in xAI’s interne evaluatieproces om de modellen te evalueren op een reeks activiteiten in de echte wereld. “Grok-2 heeft opmerkelijke verbeteringen laten zien in zijn vermogen om te redeneren met opgehaalde inhoud en in zijn mogelijkheden om gereedschappen te gebruiken, waaronder het nauwkeurig herkennen van ontbrekende informatie, het redeneren door opeenvolgingen van gebeurtenissen en het elimineren van irrelevante berichten,” beweert het bedrijf.
Volgens benchmarkgegevens die door xAI zijn vrijgegeven, laten Grok-2 en Grok-2 tiny beide aanzienlijke verbeteringen zien ten opzichte van Grok-1.5. De modellen laten concurrerende prestaties zien in domeinen als algemene kennis, wetenschappelijke kennis op graduate-niveau en wiskunde wedstrijdtaken. Vooral in vision-gebaseerde activiteiten presteert Grok-2 uitzonderlijk goed, met geavanceerde vaardigheden in documentgebaseerde vraagbeantwoording en visueel wiskundig redeneren.
Er zijn nieuwe functies en een bijgewerkte UI in de Grok-ervaring op X. Grok-2 en Grok-2 mini zullen beschikbaar zijn voor Premium en Premium+ klanten. Volgens xAI is Grok-2 “intuïtiever, stuurbaarder en veelzijdiger voor een breed scala aan taken, of je nu codeerproblemen oplost, antwoorden zoekt of samenwerkt aan schrijfprojecten.”
Om de mogelijkheden van Grok op X verder uit te breiden, werkt xAI ook samen met Black Forest Labs om hun FLUX.1 model te testen.
Later deze maand debuteert xAI met een enterprise API-platform voor ontwikkelaars. Het bedrijf biedt uitgebreide analyses voor facturering, rijke verkeersinformatie en verbeterde beveiligingsmaatregelen. Om team-, gebruikers- en factureringsbeheer op te nemen in de tools en diensten die momenteel worden gebruikt, zal er ook een beheer-API beschikbaar worden gemaakt.
In de toekomst zal multimodaal begrip een fundamenteel kenmerk zijn van de Grok-ervaring op zowel X als de API, aldus xAI. De reden voor de snelle ontwikkeling van het bedrijf sinds de onthulling van Grok-1 in november 2023 is “een klein team met de hoogste talentdichtheid.”
Om voorop te lopen in de ontwikkeling van AI is het nieuwe rekencluster van xAI gericht op het verbeteren van de basisvaardigheden voor redeneren. Maar het bedrijf heeft besloten om geen specifieke EU-gegevens meer te gebruiken om zijn modellen te bouwen.
Ook al is de introductie van Grok-2 een grote stap voorwaarts voor xAI, het is duidelijk dat er nog steeds hevige concurrentie is op de AI-markt. De strijd om de suprematie van AI is nog lang niet gestreden, met ChatGPT-4o en Google’s Gemini 1.5 aan kop en belangrijke bedrijven als Anthropic die nog steeds snelle vooruitgang boeken.