Neueste KI zur Bilderzeugung

Welche Graka? GB? Wie lange dauerte es bis die Bilder entstanden sind?

RTX 4070, 12GB VRam, limitiert auf 150Watt, sonst würde sie 200Watt verbrauchen und ganz schön warm am HotSpot werden, deshalb habe ich die Leistung erstmal begrenzt. Der Rechner ist ja neu, Spiele habe ich noch gar nicht ernsthaft gespielt, daher weiß ich noch nicht, wie die sich da dann verhält.

Bilder gehen je nach größe Ruckzuck. Bei typischen Auflösungen wie 2 Bilder in 640x840 für Menschen sind das einige Sekunden, 1024x1024 ist wie die Services im Netz und letztens habe ich ein Bild testweise in 1920x1200 für einen Wallpaper genutzt, das waren das dann schon so 40 Sekunden, wenn ich das recht in Erinnerung habe. Geht jedenfalls alles viel schneller und besser als vorher gedacht.

Und bisher kratze ich auch nur an der Oberfläche mit Standardmodels, da gibt es dann noch extra Layer die Bilder finalisieren oder man kann anhand eines Strichmännchens die Körperstellung von Menschen genauer bestimmen usw, das habe ich alles noch gar nicht ausprobiert.

Falls ich heute Zeit habe, will ich mal eigene Fotos hochladen und die dann bearbeiten lassen, was ich bei den Web-Services bisher nie gemacht habe, weil man da nie weiß, was damit passiert. Das könnte auch noch ziemlich cool sein.

Aber der Stromverbrauch ist wohl nicht ohne, das werde ich noch im Blick behalten.
 
Ich bin mal gespannt auf KI im Sounddesign, da ist sicher eine Menge möglich. Ich freu mich richtig drauf.

Text2Sample ist cool. Da beschreibt man per Prompt was man hören will. Von fertigen Songs bis totaler Müll ist alles dabei. Aber irgendwie klingt trotzdem alles spannend. Aber auch einzelne Sachen wie Percussion Loops funktionieren richtig gut, die sind dann als Sample-Grundlage wirklich gut nutzbar.

Oder man gibt dem Tool einen kurzen Soundschnippsel und das bastelt den dann ein paar Sekunden länger, auch richtig krass, was da mitunter bei rauskommt.
 
Ich dachte eher so an Sachen wie das eigene Gesicht in eine Animefigur zu verwandeln oder den Vorgarten in einen Dschungel oder sowas, mal gucken was da so geht.
Hab bei meinem Beitrag mal "Minuten" hinzugefügt.
Dein Vorhaben ist natürlich deutlich komplexer und wird beim webservice vermutlich richtig lange dauern. Kannst ja gern mal berichten.
 
RTX 4070, 12GB VRam, limitiert auf 150Watt, sonst würde sie 200Watt verbrauchen und ganz schön warm am HotSpot werden, deshalb habe ich die Leistung erstmal begrenzt.
Ich wollte mir nächstes Jahr einen neuen PC mit RTX 4080 und 16GB anschaffen. Befürchtest du wegen hohem Watt, dass die Karte löten geht?
Bilder gehen je nach größe Ruckzuck. Bei typischen Auflösungen wie 2 Bilder in 640x840 für Menschen sind das einige Sekunden.
Wow, so schnell? Mit dem Mac M1 brauche ich Minuten und das mit 512x512. :lol:
 
Ich wollte mir nächstes Jahr einen neuen PC mit RTX 4080 und 16GB anschaffen. Befürchtest du wegen hohem Watt, dass die Karte löten geht?

Es ist halt eine eher ungewöhnliche Belastung, weil die Karte für ein paar Sekunden oder bis zu einer Minute wenn das Bild eine sehr, sehr hohe Auflösung hat, auf Anschlag bei fast 80 Grad rödelt um danach dann wieder 20-30 grad weniger warm zu sein. Bei einem Spiel hat sie ja eher konstant was zu tun denke ich.

Und ein bisschen gucke ich halt auf die Stromrechnung und habe ein schlechtes Gewissen, wenn ich für ein bisschen Spaß über 200 Watt verballere, wobei das eigentlich Quatsch ist, andere Sachen verbrauchen ja noch viel mehr und ein bisschen Spaß muss man sich ja auch mal gönnen dürfen.

Mal sehen, ob ich nachher noch ein paar Bilder mache.

Wow, so schnell? Mit dem Mac M1 brauche ich Minuten und das mit 512x512. :lol:

Ich kann nachher nochmal schauen, wieviele Sekunden das genau sind.
 
Ich gehe gleich auf eine Wanderung in ein Biotop, das diesem ähnelt:

Anhang anzeigen 199372

Vielleicht mach' ich vor Ort mal ein Foto zum Vergleich...

Sodele, bin zurück von der Wanderung und hier nun das angekündigte Foto der realen Location:

1704092905488.png

Es sollte das "Brackvenn nahe Monschau-Mützenich bei Schmuddelwetter" dargestellt werden. Ich finde das Original irgendwie überzeugender. Meine Versuche, die KI dazu zu bewegen, das Ganze fotografisch genauer und ohne Nadelbäume und mit Birken zu generieren, brachten dann (u.a.) das folgende Ergebnis:


Eine Wanderung durch das Brackvenn bei Monschau-Mützenich auf Holzstegen ohne Geländer bei Sc...jpeg

Naja... geht so.
 
Es sollte das "Brackvenn nahe Monschau-Mützenich bei Schmuddelwetter" dargestellt werden. Ich finde das Original irgendwie überzeugender.
Man darf glaube ich zum aktuellen Zeitpunkt noch nicht erwarten das mit dieser KI so ein reales Bild entsteht. Ich finde dein Bild aus dem Ankündigungspost aber schon recht nah am Original für aktuelle KI-Verhältnisse.
 
Ab zu High Mobile. D1 Netz, 27GB für 20€ im Monat. SMS und Telefon Flat.
Die Bilder kannst du dann beim spazieren gehen erstellen 😉
 
...sagten sich 84 Millionen Deutsche. ;-)

Ja, deswegen halte ich mich auch ein bisschen zurück. Andererseits habe ich kein Auto, fahre immer Straßenbahn, esse wenig Fleisch und das Ganze läuft mit Ökostrom. Dann wird ein bisschen KI Generation mal drin sein dürfen.

Wahrscheinlich verbraucht der Leerlauf wenn ich hier und in anderen Foren abhänge sogar mehr Strom als die KI Berechnungen, das muss ich auch nochmal rauskriegen. Und GTA Online zocken die letzten Jahre war bestimmt auch nicht ohne.

Jedenfalls ist es gut, sich darüber Gedanken zu machen.
 
Und genau das ist das Kreative beim Umgang mit KI. Die Ergebnisse in die richtige Richtung zu schieben will auch geübt sein. Auf so einen Prompt wäre ich nie gekommen.

dinge wie gegenlicht, seitenlicht, beleuchtung, nebel, oder adjektive wie dreidimensional, windig, oder unheimlich funktionieren immer, wenn auch nicht immer so wie gedacht :) , einfach weil das wohl häufig benutzte tags beim ausgangsmaterial sind.
diese gilt es erst zu erraten, damit man sie in reinkultur zaubern kann, und dann die kippunkte zwischen zwei solcher sachen zu finden.

ohne aufgespritzte Lippen

das ist witzig, dass das "ohne" auch mit den neuesten modellen immer noch nicht geht. man könnten denken, dass die erkennung der bedeutung das webscraping material bei so einfachen sachen irgendwann bricht, aber das scheint nicht der fall zu sein.

im gegensatz zu "ohne" funktioniert "a neben b" hin und wieder schon ganz gut.
 
Sodele, bin zurück von der Wanderung und hier nun das angekündigte Foto der realen Location:

Anhang anzeigen 199494

Es sollte das "Brackvenn nahe Monschau-Mützenich bei Schmuddelwetter" dargestellt werden. Ich finde das Original irgendwie überzeugender. Meine Versuche, die KI dazu zu bewegen, das Ganze fotografisch genauer und ohne Nadelbäume und mit Birken zu generieren, brachten dann (u.a.) das folgende Ergebnis:


Anhang anzeigen 199495

Naja... geht so.

Das beste Bild was ich so hinbekommen habe. Der Bildeindruck generell stimmt, das könnte ein echtes Foto sein. Aber diese offene, karge Landschaft passt noch nicht ganz.

00014-1029461035.png
 


Neueste Beiträge

Zurück
Oben