HomeNachrichtDer Whisk AI-Generator von Google „mischt“ die von Ihnen eingefügten Bilder neu

Der Whisk AI-Generator von Google „mischt“ die von Ihnen eingefügten Bilder neu

Google hat ein neues KI-Tool namens Whisk angekündigt, mit dem Sie Bilder generieren können, indem Sie andere Bilder als Eingabeaufforderungen verwenden, anstatt eine lange Texteingabeaufforderung zu benötigen.

Mit Whisk können Sie Bilder anbieten, um das gewünschte Motiv, die Szene und den Stil Ihres KI-generierten Bildes vorzuschlagen, und Sie können Whisk mit mehreren Bildern für jedes dieser drei Dinge auffordern. (Wenn Sie möchten, können Sie auch Texteingabeaufforderungen ausfüllen.) Wenn Sie keine Bilder zur Hand haben, können Sie auf ein Würfelsymbol klicken, damit Google einige Bilder für die Eingabeaufforderungen ausfüllt (obwohl diese Bilder ebenfalls KI zu sein scheinen). -generiert). Sie können am Ende des Vorgangs auch Text in ein Textfeld eingeben, wenn Sie dem gesuchten Bild zusätzliche Details hinzufügen möchten, dies ist jedoch nicht erforderlich.

Whisk generiert dann Bilder und eine Textaufforderung für jedes Bild. Sie können das Bild zu Ihren Favoriten hinzufügen oder herunterladen, wenn Sie mit den Ergebnissen zufrieden sind, oder Sie können ein Bild verfeinern, indem Sie mehr Text in das Textfeld eingeben oder auf das Bild klicken und die Textaufforderung bearbeiten.

Ein Screenshot von Whisk. Ich habe auf die Würfel geklickt, um ein Thema, eine Szene und einen Stil zu generieren. Ich habe die automatisch generierte Szene durch Eingabe einer Textaufforderung ausgetauscht. Whisk erstellte die ersten beiden Bilder, die ich wiederholte, indem ich Whisk bat, etwas Dampf um das Motiv herum zu erzeugen (da es sich um ein Feuer im Wasser handelt), was zu den nächsten beiden Bildern führte.
Screenshot von Jay Peters / The Verge

In einem Blogbeitrag betont Google, dass Whisk für „schnelle visuelle Erkundung und nicht für pixelgenaue Bearbeitungen“ konzipiert ist. Das Unternehmen gibt außerdem an, dass Whisk möglicherweise „das Ziel verfehlt“, weshalb Sie die zugrunde liegenden Eingabeaufforderungen bearbeiten können.

In den wenigen Minuten, in denen ich das Tool beim Schreiben dieser Geschichte verwendet habe, hat es Spaß gemacht, daran herumzubasteln. Das Generieren von Bildern dauert ein paar Sekunden, was nervig ist, und obwohl die Bilder etwas seltsam waren, hat es Spaß gemacht, alles, was ich generiert habe, zu wiederholen.

Laut Google verwendet Whisk die „neueste“ Version seines heute angekündigten Imagen 3-Bilderzeugungsmodells. Google stellte außerdem Veo 2 vor, die nächste Version seines Videogenerierungsmodells, das nach Angaben des Unternehmens „die einzigartige Sprache der Kinematographie“ versteht und Dinge wie zusätzliche Finger „seltener“ halluziniert als andere Modelle (eines dieser anderen Modelle ist es). wahrscheinlich Sora von OpenAI). Veo 2 steht an erster Stelle bei Googles VideoFX, für das Sie sich auf die Google Labs-Warteliste setzen können, und wird irgendwann im nächsten Jahr auf die „anderen Produkte“ von YouTube Shorts ausgeweitet.

Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here

RELATED ARTICLES

Most Popular

Recommended News