Στην κούρσα του AI και η Alibaba - Το δικό μας καλύτερο από της DeepSeek

«Το Qwen 2.5-Max ξεπερνάει ... σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», αναφέρει η μονάδα cloud της Alibaba σε ανακοίνωσή της την οποία ανήρτησε στον επίσημο λογαριασμό της στο WeChat

Η κινεζική τεχνολογική εταιρεία Alibaba παρουσίασε σήμερα μια νέα εκδοχή του μοντέλου τεχνητής νοημοσύνης της Qwen 2.5, για την οποία υποστηρίζει πως υπερτερεί του περίφημου DeepSeek-V3.

Ο ασυνήθιστος χρόνος της κυκλοφορίας του Qwen 2.5-Max, την πρώτη ημέρα του Σεληνιακού Νέου Έτους, όταν οι περισσότεροι Κινέζοι έχουν αργία και βρίσκονται με τις οικογένειές τους, σηματοδοτεί την πίεση που ασκεί η μετεωρική άνοδος τις τρεις τελευταίες εβδομάδες της κινεζικής εταιρείας τεχνητής νοημοσύνης DeepSeek, όχι μόνο στους ανταγωνιστές της στο εξωτερικό, αλλά και στον εγχώριο ανταγωνισμό.

«Το Qwen 2.5-Max ξεπερνάει ... σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», αναφέρει η μονάδα cloud της Alibaba σε ανακοίνωσή της την οποία ανήρτησε στον επίσημο λογαριασμό της στο WeChat, αναφερόμενη στα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης ανοικτού κώδικα.

Η παρουσίαση στις 10 Ιανουαρίου του βοηθού τεχνητής νοημοσύνης της DeepSeek, με βάση το μοντέλο DeepSeek-V3, καθώς και η παρουσίαση στις 20 Ιανουαρίου του μοντέλου της R1, προκάλεσε σοκ στην Σίλικον Βάλεϊ και έριξε τις μετοχές των τεχνολογικών εταιρειών, καθώς τα χαμηλά κόστη ανάπτυξης και χρήσης της κινεζικής startup έκαναν τους επενδυτές να αμφισβητήσουν τα σχέδια για τεράστιες δαπάνες από τις κορυφαίες εταιρείες τεχνητής νοημοσύνης στις ΗΠΑ.

Ωστόσο η επιτυχία της DeepSeek έκανε επίσης τους εγχώριους ανταγωνιστές της να αναβαθμίσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης.

Δύο ημέρες μετά την παρουσίαση του DeepSeek-R1, η ιδιοκτήτρια του TikTok, η ByteDance, παρουσίασε μια επικαιροποίηση του δικού της βασικού μοντέλου τεχνητής νοημοσύνης, για το οποίο ισχυρίστηκε πως έχει καλύτερες επιδόσεις από το υποστηριζόμενο από τη Microsoft o1 της OpenAI στο AIME, ένα τεστ που μετράει πόσο καλά τα μοντέλα τεχνητής νοημοσύνης κατανοούν περίπλοκες οδηγίες και ανταποκρίνονται σ' αυτές.

Αυτό απηχεί τον ισχυρισμό της DeepSeek ότι το μοντέλο της R1 υπερτερεί σε αρκετά κριτήρια απόδοσης του o1 της OpenAI.

Πηγή: ΑΠΕ -ΜΠΕ

 

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΑ