Neueste KI zur Bilderzeugung

Arbeitet eine der KI so, dass ein Referenzpunkt gesetzt werden kann? DALL-E z.B. fängt ja quasi immer neu an.
 
was sich immerhin so ähnlich anfühlt ist ja wenn du bilder als eingabe nimmst, vereinfacht gesagt "zum lernen", und du dafür den letzten bild-output nimmst. dann ensteht eine art dialog der marke "kannst du noch was ergänzen" oder "kannst du mir was anderes machen, aber in diesem stil."
nur mit prompts weiter gehen wäre toll und ist sicherlich grundsätzlich möglich, habe ich aber noch nicht gesehen.

auch das kandinsky video app von rudalle startet bei einem bild und interpretiert es um die folgesequenzen daraus zu erstellen. leider ist das das einzige, was mit diesen video teilen geht, und nach 4 jahren wird es langsam langweilig.


die neue seite funktioniert immer noch nicht so ganz. https://rudalle.ru/
bildgröße und grundsätzliche funktion sind nach 2 wochen voller bugs aktuell wieder in betrieb, aber aufgrund der scripte ist die seite etwas langsamer wie vorher.

allerdings geht der png download via download button noch nicht. erst wenn man das vergrößerte bild erneut in einem neuen tab öffnet kann man das jpg downloaden. damit ist es im moment umständlicher als das alte.

seit gestern ist der download button auf der start page wieder weg. dort war neulich auch ein "nochmal" button, das war genial, da hast du nur 2 mal geklickt und schon hattest du eine neue version.

schön ist, dass die archivierten in der app eine weile erhalten bleiben, auf der basis von cookies, kein account notwendig.
 
nur mit prompts weiter gehen wäre toll und ist sicherlich grundsätzlich möglich, habe ich aber noch nicht gesehen.
Wenn ich dich jetzt nicht falsch verstanden habe, dann geht das doch mit Chat GPT?! Zumindest auf dem Papier - tatsächlich ist der Dialog recht oberflächlich...*

Aber etwas kann man da schon drauf aubauen. Ist also nicht 100% bei Null.

* zudem agiert DALL-E in Kombi mit Chat GTP zwar dann nicht ganz willkürlich, allerdings doch recht sprunghaft und auch gern mit Fehlern.

M: Zeichne ein Winterlandschaft
D: Alles klar
M: Setze den See weiter rechts in das Bild
D: >Ändert nicht die Position des Sees sondern setzt "deformierte" Tiere ein
M: Neuer Versuch - ohne Tiere!
D: Tiere wurden entfernt und der See weiter rechts im platziert
M: schön wäre es...

Hatte die Thematik bisher nur etwas verfolgt, aber bis vor kurzem nicht genutzt.

Im moment bin ich quasi an dem zweiten Bild dran.

Achso, schade ist halt bei Chat GPT, dass man nur ne begrenzte Anzahl an Versuchen hat (alle 24h). Mir scheint aber auch das dort die Prompts strikter umgesetzt werden, wie bei rudalle. Und bei Rudalle kann man auch Bilder hochladen?

Etwas seltsam finde ich es, dass da noch immer viel Frankenstein auf Acid rauskommt. Falsches Futter?
 
ja ja, das mit dem "dialog zur korrektur" kommt so langsam. aber ich sehe da keine großartige anwendung dafür. dann lieber gleich die methodik in touch designer & co selbst basteln.

sprache versteht unser kostenloser russischer freund nicht ganz so gut wie chatgpt pro. vor allem solche anweisung wie "..., und links davon noch ein größeres" o.ä. laufen meist ins leere
mich persönlich störts nicht, muss man halt seine sprache ans programm adaptieren.
 
Mehr Kontrolle fänd ich halt schon gut. Immerhin kann man bei chat gpt den Prompt so etwas verfeinern. Geht dann aber auch gern mal sprunghaft in die falsche Richtung.
 


Zurück
Oben