Google hat ein neues KI-Tool namens Whisk angekündigt, mit dem Sie Bilder generieren können, indem Sie andere Bilder als Eingabeaufforderungen verwenden, anstatt eine lange Texteingabeaufforderung zu benötigen.
Mit Whisk können Sie Bilder anbieten, um das gewünschte Motiv, die Szene und den Stil Ihres KI-generierten Bildes vorzuschlagen, und Sie können Whisk mit mehreren Bildern für jedes dieser drei Dinge auffordern. (Wenn Sie möchten, können Sie auch Texteingabeaufforderungen ausfüllen.) Wenn Sie keine Bilder zur Hand haben, können Sie auf ein Würfelsymbol klicken, damit Google einige Bilder für die Eingabeaufforderungen ausfüllt (obwohl diese Bilder ebenfalls KI zu sein scheinen). -generiert). Sie können am Ende des Vorgangs auch Text in ein Textfeld eingeben, wenn Sie dem gesuchten Bild zusätzliche Details hinzufügen möchten, dies ist jedoch nicht erforderlich.
Whisk generiert dann Bilder und eine Textaufforderung für jedes Bild. Sie können das Bild zu Ihren Favoriten hinzufügen oder herunterladen, wenn Sie mit den Ergebnissen zufrieden sind, oder Sie können ein Bild verfeinern, indem Sie mehr Text in das Textfeld eingeben oder auf das Bild klicken und die Textaufforderung bearbeiten.
In einem Blogbeitrag betont Google, dass Whisk für „schnelle visuelle Erkundung und nicht für pixelgenaue Bearbeitungen“ konzipiert ist. Das Unternehmen gibt außerdem an, dass Whisk möglicherweise „das Ziel verfehlt“, weshalb Sie die zugrunde liegenden Eingabeaufforderungen bearbeiten können.
In den wenigen Minuten, in denen ich das Tool beim Schreiben dieser Geschichte verwendet habe, hat es Spaß gemacht, daran herumzubasteln. Das Generieren von Bildern dauert ein paar Sekunden, was nervig ist, und obwohl die Bilder etwas seltsam waren, hat es Spaß gemacht, alles, was ich generiert habe, zu wiederholen.
Laut Google verwendet Whisk die „neueste“ Version seines heute angekündigten Imagen 3-Bilderzeugungsmodells. Google stellte außerdem Veo 2 vor, die nächste Version seines Videogenerierungsmodells, das nach Angaben des Unternehmens „die einzigartige Sprache der Kinematographie“ versteht und Dinge wie zusätzliche Finger „seltener“ halluziniert als andere Modelle (eines dieser anderen Modelle ist es). wahrscheinlich Sora von OpenAI). Veo 2 steht an erster Stelle bei Googles VideoFX, für das Sie sich auf die Google Labs-Warteliste setzen können, und wird irgendwann im nächsten Jahr auf die „anderen Produkte“ von YouTube Shorts ausgeweitet.