Neueste KI zur Bilderzeugung

Und wieder einmal hat der Zensur-Möpp zugeschlagen:

1708149097633.png

...während eine einzelne in sich verknotete Brille noch klaglos generiert wird:

eine in sich verknotete Brille-1.jpeg

Man könnte ja befürchten, dass gleich zwei (oder gar mehr... hach Gottchen) ineinander verknotete Brillen gerade Sex miteinander haben. Wo bekämen wir denn da hin? Das wäre ja Erregung öffentlichen Ärgernisses...

B.T.W.: Ich bin von der Forensoftware wieder einmal eine Woche lang nicht über neue Posts (diesmal diesen Thread betreffend) informiert worden. Man könnte ja glatt auf die Idee kommen, dass Programmierer ihr Handwerk im Grunde genommen nicht verstehen...

(...sondern nur 'rumprobieren bissetirjentwieleuft.) ;-)
 
Zweiter Versuch:
1708150154167.png

Jetzt werden aus den Brillen Gläser (klar: Berülle auf Englisch = Glasses; Plural, weil ja zwei Gläser=Linsen im Jestell drin stecken)

Aber himmelherrgottzackramentnochmal, wenn die K.I. wirklich intelligent wäre, müsste sie diese Mehrdeutigkeiten bei zwischengeschalteter Übersetzung erkennen und bedenken (denken? ischlaachmischkapott...).

Noch ein Fehler: plötzlich sind die Dinger nicht mehr ineinander verknotet, sondern miteinander über ein kitschiges Schleifchen verbunden. Selbst ein noch so doofer, schielender Glasbläser würde sofort wissen, dass man die Gläser über deren Stiele ineinander verknoten könnte, die K.I. anscheinend nicht.

Wo ist mein Betablocker?
 
Zweiter Versuch:


Jetzt werden aus den Brillen Gläser (klar: Berülle auf Englisch = Glasses; Plural, weil ja zwei Gläser=Linsen im Jestell drin stecken)

Aber himmelherrgottzackramentnochmal, wenn die K.I. wirklich intelligent wäre, müsste sie diese Mehrdeutigkeiten bei zwischengeschalteter Übersetzung erkennen und bedenken (denken? ischlaachmischkapott...).

Noch ein Fehler: plötzlich sind die Dinger nicht mehr ineinander verknotet, sondern miteinander über ein kitschiges Schleifchen verbunden. Selbst ein noch so doofer, schielender Glasbläser würde sofort wissen, dass man die Gläser über deren Stiele ineinander verknoten könnte, die K.I. anscheinend nicht.

Wo ist mein Betablocker?

Das ist in der Tat nicht befriedigend zu lösen. Zunächst ist die Brille "glasses" ja im englischen synonym mit den (Trink)Gläsern. Das gibt dann die Ergebnisse oben. Abhilfe schafft für die Differenzierung das englische Synonym "pair of glasses" oder "spectacles".

Dann gibt es aus meiner Sicht als Training für die KI schlichtweg keine Bilder bei deinen zwei Brillen miteinander verknotet wären.
Mein bestes Ergebnis:

_0423f2c5-7c34-424d-9bc5-17f2729408fe.jpeg

Bestes "Hochzeitsbild" :cool:

OIG3.jpg



Grüße aus München!
 
Interessant. Bei Stable Diffusion, zumindest in dem Model was ich genutzt habe, werden automatisch die passenden Menschen dazu generiert. Ein Paar sind dann halt oft zwei Menschen, die Brillen tragen.

Oder eben Gläser. Man kann das ganze umgehen, indem man bestimme Brillentypen nimmt, also Sunglasses zB, die sind dann eindeutig. Allerdings sah das bei mir auch nicht wirklich gut aus, sind oft auch nur einzelne Sonnenbrillen.

00009-2732276427.png00014-1809936430.png
 
bei einer recherche habe ich sf-serientitel entdeckt, die in einer liste für bandnamen ganz weit oben stehen dürften:
  • Captain Video and His Video Rangers
  • The Purple Monster Strikes
  • Atom Squad
  • Birdman and the Galaxy Trio
  • Captain Z-Ro (& The)
  • Radar Men from the Moon
falls nicht selbst schon getestet - hier mal was BIC dazu meint bzw damit anstellt (jeweils ohne Zusätze, also rein nur die Titel als Prompt und nur ein Boost/Versuch pro Titel) :


Captain Video and His Video Rangers

OIG4._y6t2aO5Ca9PV.jpgOIG4fff.jpgOIGddff4.jpgOIGdd4.jpg



The Purple Monster Strikes

OIGdggggd3.jpg OIG3.cu3sYxQ0HyJhf.jpg
..ähem.. belassen wir es hier mal bei 2 von 4 Ergebnissen



Atom Squad
OIGd4.jpg OIfffG4.jpg
..ähem2.. belassen wir es hier mal bei 2 von 4 Ergebnissen



Birdman and the Galaxy Trio

OIGfff4.jpgOIG4.DF0.jpgOIG4.mLCLXZ6Pzy5qVi7iu9.jpgOIG4.8uFcvZd.jpg



Captain Z-Ro

OIG2.1ze_CngZ.jpgOIGsggs2.jpgOIGsshsh2.jpgOIGdhdhd2.jpg



Radar Men from the Moon

OIG2ggsg.jpgOIG2sggs.jpgOIG2sgsggsg.jpgOIG2.G0p2xBZlgPRcC.jpg


✌️😎
 
Das mykologische Fachwissen der künstlichen "Intelligenz" ist indes noch sehr ausbaufähig:

Statt Puppen tanzen zu lassen, hab' ich es mal mit Pilzen versucht. Die jeweilig dargestellte Species ist dem Prompt (=Dateinamen) zu entnehmen. Das Entdecken der von der K.I. eingebauten morphologischen Fehler überlasse ich Euch... ;-)

Eine Morchella conica turnt am Boden-1.jpegEine Hygrophoropsis aurantiaca turnt am Boden-4.jpegEine Hygrophoropsis aurantiaca turnt am Boden-1.jpegEin Boletus edulis turnt am Boden-2.jpegEin Cantharellus cibarius turnt am Boden-7.jpeg

Den Pfifferling - oder das, was einen Pfifferling* beim Bodenturnen darstellen sollte - hat die K.I. in acht (!) Versuchen kein einziges Mal in der gewünschten Tätigkeit dargestellt, obwohl es bei anderen Pilz-Species ging.

Seltsam.


PS: *Die Erkennungsmerkmale wurden von der K.I. in keinster Weise korrekt umgesetzt. Allenfalls Färbung und Habitat sind korrekt...
 
Zuletzt bearbeitet:
Den Pfifferling - oder das, was einen Pfifferling* beim Bodenturnen darstellen sollte - hat die K.I. in acht (!) Versuchen kein einziges Mal in der gewünschten Tätigkeit dargestellt, obwohl es bei anderen Pilz-Species ging.

Seltsam.
Na immerhin hat dein Pfifferling ein Ballettröckchen an - das ist doch schon ein Anfang. 💃🕺
 
Hallo zusammen.
Ich wollte mich nur mal bei euch bedanken. Lese hier fleißig mit und habe einige nützliche Tipps gelernt.
Ja man könnte sich bei den Kopfhörern fragen wie das geht, aber egal.

Hase_3.jpg
 
Wie ist denn das mit der "KI" bei Stable Diffusen, wenn es offline generiert wird, lernt da die KI noch was dazu, oder ist das berhaupt eine KI?

Die lernen generell nichts dazu. Nur die Modelle an sich, wenn sie trainiert werden. Es ist also nicht so, dass die KI im Internet nach passenden Bildern suchen könnte oder ähnliches.
Bisher muss immer noch jemand die KI mit Bildern gefüttert und trainiert haben. Egal ob das dann der PC zuhause berechnet oder irgendein Server im Netz, die KI kann nur auf diese Trainings-Daten zugreifen.

Zumindest ist das mein Stand der Dinge aber ich denke da unterscheided sich Stable Diffusion nicht von Bing, Midjourney & Co.
 
alles MS Copilot, finde ihn ganz ok nach wie vor, muss bei Gelegenheit mal was anders ausprobieren.




Jules Verne Reise zum Mittelpunkt der Erde

Der Bibliothekar

Schweine im Weltall

Pinhead und Eddie in einem Pub in Ankh Morpork

Alien mit Ostereiern

was Giger mäßiges

Synth Spieler , psychedelic Art

Ein Motiv aus The Terror (Buch)

Orang Utan mit Bitcoin
 

Anhänge

  • OIG4 (2).jpeg
    OIG4 (2).jpeg
    390 KB · Aufrufe: 9
  • OIG2.jpeg
    OIG2.jpeg
    335,9 KB · Aufrufe: 8
  • OIG1.QsYLtV.jpeg
    OIG1.QsYLtV.jpeg
    285,1 KB · Aufrufe: 9
  • OIG2 (3).jpeg
    OIG2 (3).jpeg
    210,3 KB · Aufrufe: 9
  • OIG2 (2).jpeg
    OIG2 (2).jpeg
    217,5 KB · Aufrufe: 11
  • OIGa2.jpeg
    OIGa2.jpeg
    267,4 KB · Aufrufe: 11
  • Librarian 1.jpeg
    Librarian 1.jpeg
    205 KB · Aufrufe: 10
  • _385b1833-663e-401e-8374-15a853cf04e8.jpeg
    _385b1833-663e-401e-8374-15a853cf04e8.jpeg
    303,1 KB · Aufrufe: 10
  • OIG3 (1).jpeg
    OIG3 (1).jpeg
    244,5 KB · Aufrufe: 9
Zuletzt bearbeitet:


Neueste Beiträge

News

Zurück
Oben