Baidu hat vor Kurzem einen weiteren großen Schritt gewagt und gleich zwei neue Modelle herausgebracht – Wenxin 4.5 und Inference Model X1 .
Noch überraschender ist, dass diese beiden Modelle ursprünglich am 1. April kostenlos der Öffentlichkeit zugänglich gemacht werden sollten, jetzt aber jeder sie kostenlos erleben kann.

Wenxin 4.5 ist ein multimodales Modell , das Text, Bilder, Videos, Audio und andere Inhalte umfassend interpretieren kann und dessen Fähigkeiten die von GPT-4o von OpenAI bei weitem übertreffen.
Wie DeepSeek-R1 verfügt X1 über die Fähigkeit, tiefgründig zu denken , die gestellten Fragen zu verstehen, zu planen, zu reflektieren und weiterzuentwickeln und unterstützt außerdem Multimodalität.
Noch erstaunlicher ist, dass X1 auch das erste ist, das automatisch auf viele Spezialtools wie erweiterte Suche, Fragen und Antworten zu Dokumenten, KI-Zeichnung, Code-Interpreter, Lesen von Weblinks, Baidu-Akademiesuche usw. zugreift.
denken.
Ich muss sagen, dass die Entwicklung von Wen Xin Yi Yan wirklich dramatisch ist.
Vor zwei Jahren kam es aus dem Nichts. Es war das erste große Modell in unserem Land . Alle waren damals so aufgeregt, als ob wir die chinesische Version von ChatGPT gesehen hätten.
Doch die guten Zeiten währten nicht lange. Als immer mehr „Gegner“ auftauchten, begannen bei Wen Xin Yiyan einige Probleme aufzutreten.
Erstens ist die Produktpositionierung etwas wackelig. Mal wollen sie die Suche verbessern, mal stürzen sie sich in die kreative Umsetzung. Ihre Kernkompetenzen verschwimmen zunehmend. Das ist natürlich ein häufiger Schwachpunkt für die meisten Modellunternehmen.
Ein weiterer Punkt ist, dass die Ladestrategie etwas zu voreilig ist. Dieser Schritt hat bei vielen Nutzern den Eindruck hervorgerufen, dass die Kosteneffizienz nicht hoch ist und sie haben sich entschieden, abzuwarten oder einfach auf andere Plattformen umzusteigen.
Erst als DeepSeek populär wurde, erkannten die Leute , dass das Modell selbst zu einem Kernprodukt werden könnte, um Benutzer anzuziehen, und dass es keinen Grund gab, sich so schnell andere Tricks auszudenken.
Dennoch habe ich aus Erfahrung festgestellt, dass das Update von Wenxin YiyanX und Version 4.5 tatsächlich einige bedeutende Fortschritte gebracht hat und dass es ein Versuch sein sollte, den Rückstand aufzuholen, der in den letzten zwei Jahren gegenüber anderen großen Modellen entstanden ist.
Betrachtet man den gesamten Inlandsmarkt, so bildet sich mit der kontinuierlichen Iteration und Verbesserung von Produkten wie DeepSeek, Doubao und Kimi sowie den Bemühungen von Wenxin Yiyan dieses Mal eine gesunde Wettbewerbssituation im Bereich der inländischen Großmodelle heraus, was ziemlich interessant ist.
Ai+.
Heute werde ich mit Ihnen zwei Modelle von Baidu bewerten.
Ich habe die URL hier eingefügt: https://yiyan.baidu.com/
Wenxin-4.5
Schauen wir uns zunächst Wenxin 4.5 an. Ich habe ihm ein Bild geschickt, um zu sehen, ob es es erkennt.

Infolgedessen wurde es tatsächlich als eine Achattasse mit Tierkopf aus der Tang-Dynastie erkannt, ein Kulturrelikt mit reichem kulturellen Erbe.
Dann habe ich das Meme-Bild geändert, um zu sehen, ob es den Witz verstehen könnte.

Ich hätte nicht erwartet, dass es die Bedeutung grundsätzlich erfassen kann. Seine Fähigkeit, Bilder zu verstehen, ist wirklich gut.
Dann habe ich den Schwierigkeitsgrad erhöht und ein Bild ohne Worte gesendet, um Wenxin 4.5 zu testen.

Daraufhin antwortete Wenxin 4.5 direkt, dass es sich um „Die Verurteilten“ handele, was völlig richtig war.
Man kann sagen, dass die Kombination aus Baidu-Indexdaten und multimodalen Modellen wirklich leistungsstark ist . Und es ist multimodal, nicht nur auf Bilder beschränkt, sondern kann auch Audio und Video vollständig erkennen.
Was mich noch mehr überraschte, war, dass Wenxin 4.5 auch kontinuierliche Bilder mit mehreren Szenen erzeugen kann.
Ich habe zum Beispiel ein Foto von meinem Freund gemacht und ihn in Iron Man verwandelt.

Der Effekt ist echt cool.
Kommen wir nun zu den Schreibfähigkeiten. Wenxin 4.5 schneidet beim Schreiben relativ starrer und vorgefertigter Inhalte recht gut ab.
Aber wenn ich eine Geschichte schreiben würde, müsste ich meine Schreibfähigkeiten verbessern. Manchmal habe ich das Gefühl, dass die Geschichten, die es schreibt, etwas „steif“ und nicht ausgefeilt genug sind.
Argumentationsmodell X1
Als nächstes testen wir ein weiteres Kernmodell von Baidu – Wenxin X1
Lassen Sie X1 die Geschichte neu schreiben:
Die Texte von Wenxin X1 scheinen einen eigenen Stil zu haben und sind nicht mehr so steif wie früher. Sie sind recht interessant zu lesen und wirken ein bisschen wie ein Roman.
Ich möchte es anders versuchen. Ich werde es bitten, den Vorfall mit den wiederaufbereiteten Damenbinden, der bei der diesjährigen CCTV 315 Gala aufgedeckt wurde, sarkastisch zu kommentieren. Um die aktuellen Hotspots zu verfolgen, habe ich die Online-Suche genutzt.

Schauen wir uns zunächst den Denkprozess von Wenxin X1 an. Gemessen an seinem Denkpfad ist die Logik sehr klar und es handelt sich um echtes „Denken“.

Schauen Sie sich abschließend die Antwort an:

Dieses Maul ist wirklich so schlecht wie DeepSeekR1. Es scheint, dass Baidu sich diesmal große Mühe gegeben hat.
Da es sich um ein Denkmodell handelt, muss seine Fähigkeit zum logischen Denken sorgfältig getestet werden.
Bei der Prüfungsfrage handelt es sich weiterhin um die klassische Ballkollisionscode-Frage, die nicht nur das physikalische Verständnis des Modells prüft, sondern auch mathematische Berechnungs- und Programmierfähigkeiten einbezieht.
Ich habe Grok3, DeepSeek und ChatGPT bereits in früheren Artikeln für diese Aufgabe getestet. Die Ergebnisse variieren. Interessierte können einen Blick darauf werfen: 👉Wer ist die stärkste KI?! Beim Testen von Grok3, DeepSeek und ChatGPT sind die Ergebnisse der vier Dimensionen unerwartet.
Stichwort : Schreiben Sie einen HTML-Code. In der Mitte der Webseite befindet sich ein regelmäßiges Sechseck. Darin befindet sich ein Partikel mit einer Anfangsgeschwindigkeit. Es prallt zurück, wenn es die Grenze des Sechsecks berührt. Bei jeder Berührung ändert die Grenze zufällig ihre Farbe.
Werfen wir diesmal einen Blick auf die Leistung von Wenxin X1:
Erstens habe ich während des Denkprozesses 3 Minuten gewartet, was etwas langsam war. Zweitens war der Laufeffekt nicht sehr gut und der Ball konnte nur dieselben zwei Seiten treffen.

Dies zeigt, dass Wenxin X1 in Bezug auf logisches Denken tatsächlich einige Mängel aufweisen kann. Zumindest aus diesem Test geht hervor, dass es noch ein Stück von den besten Modellen der Branche im Bereich logisches Denken entfernt ist.
Aber ich finde, dass die Tool-Aufruffunktionen von Wenxin X1 wirklich auffällig sind.
Ich möchte Ihnen ein Beispiel erzählen, das mich schockiert hat: Ich bat es, mir bei der Überarbeitung eines Romans zu helfen, woraufhin es ein Doc-Dokument mit dem geänderten Inhalt erstellte und es mir übermittelte.
Schauen wir uns die Funktionsweise an: Zuerst ruft es das Tool „Document Q&A“ auf, dann verwendet es das Tool „Code Interpreter“, also insgesamt drei Toolaufrufe.

Nach mehr als einer Minute der Überarbeitung erhielt ich ein ordentliches und übersichtliches Dokument.
Dies ist möglicherweise das erste Deep-Thinking-Modell der Branche, das autonomes Tool-Calling unterstützt. Die Kombination aus logischer Argumentationsfähigkeit, Netzwerkfunktion und leistungsstarker Tool-Calling-Fähigkeit ist wirklich erstaunlich.
Darüber hinaus ist der API-Preis sehr günstig, er beträgt sowohl hinsichtlich der Eingabe als auch der Ausgabe die Hälfte des Preises von DeepSeeks R1.
Insgesamt hat mich die Leistung des Wenxin X1 dieses Mal wirklich beeindruckt.
Drei Sätze.
Lassen Sie mich dies heute mit Ihnen teilen. Abschließend fasse ich es in drei Sätzen zusammen:
1. Wenxin 4.5 ist ein multimodales Modell, das Text, Bilder, Videos, Audio und andere Dinge verstehen kann und über eine gute Interpretationsfähigkeit verfügt.
2. Wenxin X1 weist noch einige Mängel im logischen Denken auf und es besteht noch immer eine Lücke zwischen ihm und den besten Denkmodellen der Branche.
3. Die Tool-Aufruffunktion von Wenxin X1 ist wirklich auffällig.