Neueste KI zur Bilderzeugung

aljen · 22. August 2023

Habe im Heimstudio aufgeräumt, schließlhab ich gerade einen Gastmusiker da…

In einer heruntergekommenen, dunklen, leeren Bar im Stil von Edward Hopper sitzt ein rostige-...jpeg

aljen · 22. August 2023

Teile der prompts sind in den Dateinamen enthalten. ;-)

im Stil der 1950er Jahre Zeitungsillustrationen in leichten Graustufen einen rosti-9999916.jpeg

im Stil der 1950er Jahre Zeitungsillustrationen in leichten Graustufen einen rosti-9999929.jpeg

aljen · 22. August 2023

Lois schrieb:
versuchen Sie diesen Dienst. Dies ist die neueste KI-Entwicklung zum Empfangen […]

Sorry, aber den Bildbeispielen nach zu beurteilen handelt es sich eher um eine Art Sonder-K-Intelligenzija. (Eventuell mit eingebauter по шарам-Simulation? Das würde jedenfalls die völlig diskoordinierten Darstellungen hinreichend erklären.) Wie auch immer, Sonderlösungen können die russischen Wissenschaftler, keine Frage, Künste auch, ob es der große Maler Ivan Gogh war oder der Philosoph und Mathematiker Pietja Goras oder der berühmte Modedesigner Woroschilow … Erst gerade wieder mit der gelungenen Mond-Sonderlandung die Sososonderfähigkeiten im bis dato so beworbenen KernkompetenzBereich zweifelsfrei bewiesen.

im Ernst jetzt: einem Z-erver auch nur einen Klick zu geben fände ich persönlich derzeit zum Schämen.

Lois · 2. September 2023

aljen schrieb:
im Ernst jetzt: einem Z-erver auch nur einen Klick zu geben fände ich persönlich derzeit zum Schämen.

https://app.leonardo.ai/ Hier ist ein stärkeres neuronales Netzwerk

darsho · 9. Oktober 2023

Ich nutze derzeit das von Microsoft, irgendwie bekomme ich damit am ehesten hin was ich möchte.

Bing Image Creator

Der kostenlose, KI-gestützte Bing Image Creator wandelt Ihre Wörter in Sekundenschnelle in beeindruckende Bilder um. Generieren Sie Bilder schnell und einfach, unterstützt von DALL-E.

www.bing.com

darsho · 10. Oktober 2023

Bing:

"wedding phote of a japanese couple in the 1950s"

"custom shoe"

"train riding into the sunset, lake and mountains, fantasy acrylic"

"cowboy riding on a horse, throwing a lasso towards a bull" - mit dem Lasso hat Bing noch Probleme bei dem einen Bild...

"soccer player scoring a goal with a bicycle kick. The player is at the 12 yard spot, his back facing towards the goal." - Fail , Bing weiß nicht wo der 12 yard spot ist

"American Football Player making a touchdown. another player close behind him trying to tackle"

"gothic music party like in 90s year Zwischenfall club in Bochum, Germany" - Nunja, also so ging es dort damals nicht zu, rofl

"hyperrealistic photo of a custom designed basketball sneaker"

"street scene of 1925 Berlin, with pedestrians and a tram. make sure faces of people are realsistic." - puh also die Gesicher....

"DHL delivery driver handing a package to a happy customer. hyperrealsistic photo. SIngapore setting, sunny day."

Casetti · 10. Oktober 2023

@darsho : vielleicht könntest du die prompts und kommentare beim nächsten mal unter die abbildungen schieben? danke ; )

darsho · 10. Oktober 2023

hab es überarbeitet

Casetti · 10. Oktober 2023

ja, geht leider nur mit größerer abbildung.
mach ich zwar auch nicht immer, aber ist vielleicht angenehmer immer nur 2-3 jpgs zu posten, das "erschlägt einen" nicht so ; )

Casetti · 10. Oktober 2023

ich finde die customer shoes, Berliner strassenszene und die paketübergabe #2 schon ziemlich gelungen für ein gratisprogramm.

klangumsetzer · 10. Oktober 2023

Ich habe die ai benutzt um einen neuen Avatar zu generieren und bin mit dem Ergebnis zufrieden. Danke fuer den link.
Die Farben sind vielleicht etwas zu duester/zu kalt, aber das laesst sich noch anpassen.

darsho · 12. Oktober 2023

prompt : african lady in her 30s, psychedelic art.

prompt: causcasian, long haired guitar player, psychedelic art

prompt: long haired asian keyboard player, psychedelic art

prompt : african lady in her30s , singing into a microphone, psychedelic art

prompt : 60yo drummer with beard and long hair, psychedelic art

alles bing/Dall E 3

darsho · 12. Oktober 2023

Casetti schrieb:
ich finde die customer shoes, Berliner strassenszene und die paketübergabe #2 schon ziemlich gelungen für ein gratisprogramm.

ja ich bin ganz schön baff, was man damit schon machen kann. An die kostenpflichtigen Sachen habe ich mich noch nicht rangetraut.

elabtronx · 13. Oktober 2023

ach hier war der andere Thread (ah, ein übersehenes unterforum).. genau den (hier erwähnten) meinte ich,
.. ist der Resin, Liquid, Petri Art.. in Media 2.0 gar kein AI Thread?
voll 4wirred ei am..
watt eva..
ich mache seit 2 Tagen jedenfalls kaum noch was anderes lol

electronic music machine you can see through slits a slight fire shimmer from inside machine, smoke rises out of machine,
two robotic hands control machine, 3d art, abstract, dark industrial metal look.

Area88 · 13. Oktober 2023

eLabTronX schrieb:
mache seit 2 Tagen jedenfalls kaum noch was anderes lol

dasjamakuhl™

einseinsnull · 18. Oktober 2023

darsho schrieb:
ja ich bin ganz schön baff, was man damit schon machen kann. An die kostenpflichtigen Sachen habe ich mich noch nicht rangetraut.

ich habe noch kein kostenpflichtiges angebot gefunden, was mir irgendeinen preis wert wäre, da ich mich nur für abstrakte ergebnisse interessiere, wozu man erst mal einiges darüber lernen muss wie man prompts schreibt.

da gibt es ja tatsächlich angebote wo man für 30 euro 75 bilder erstellen kann... die richten sich ganz offenbar weniger an gelangweiligte nerds oder untergrundkünstler auf der suche nach collagenmaterial als denn vielmehr an agenturen, die dort ohne viel verstand prompts der marke "ein holzstuhl in einem weißen zimmer" eingeben um das erwartebare und langweilige ergebnis davon dann auf die webseite eines kunden zu tun ohne die 50 euro lizenzgebühr bei picture-sonstwas.com bezahlen zu müssen.

bei der demoversion der sber bank mache ich 8 tabs auf, kopiere meine prompt rein, und 90 sekunden später habe ich 8 versionen. das durchgeklicke mit den captchas hat man nach einer halben stunde auswendig drauf und dann nervt es plötzlich garnicht mehr. mit jedem anderer software wäre das gleiche viel mehr arbeit.

das einzige, was nicht ideal ist, ist natürlich das größenlimit von 1024, und dass man es nicht automatisieren kann (vor allem wegen dem captcha). dafür wäre ich bereit einen monaltiche gebühr zu bezahlen - oder eine transfer/berechnen-gebühr.

ist euch aufgefallen, dass ARD und ZDF inzwischen auf KI bilder zurückgreifen?

gestern war in der tagesschau eines mit einem satelliten, heute ist da eines mit einer rakete.

beide darstellungen sollen etas zeigen, was es noch nicht gibt weil es erst in der zukunft passieren wird - perfekter use case.

einseinsnull · 18. Oktober 2023

aljen schrieb:
Sorry, aber den Bildbeispielen nach zu beurteilen handelt es sich eher um eine Art Sonder-K-Intelligenzija. (Eventuell mit eingebauter по шарам-Simulation? Das würde jedenfalls die völlig diskoordinierten Darstellungen hinreichend erklären

das ist alles openAI, also das gleiche was jeder zweite anbieter benutzt.

aber man muss es natürlich bedienen können. ;-)

was ich sehr interessant finde ist, dass man es komplett vergessen kann seinen üblichen stil prompts zu verfassen von einem zum anderen dienst zu übertragen.

man ist da immer nur auf dem einen gut, und macht man das gleiche woanders kommt nicht das raus, was man gerne hätte.

wir basteln uns hier zur zeit ein großes archiv mit grundmaterial zum weiterverarbeiten für kunst, und der gute dalli hat da inzwischen neben maya, blender, drawing tablets, fotoapparaten, animationsprogrammen und max/msp einen festen platz unter den tools.

einseinsnull · 18. Oktober 2023

störend bleibt, dass sich objekthaftes fast grundsätzlich in der mitte befindet und es keinen einheitlichen trick gibt wie man das gezielter platziert.

ebenfalls ein wenig nervig ist, dass farben grundsätzlich überzeichnet und übersättigt sind und insbesondere "grün" immer das gleiche grün wird. das kann man zwar später woanders leicht ändern, aber für die inspiration ist das nicht so toll.

die textausgabe soll in kandinski 3.x stark verbessert sein (wer´s braucht), auf den rest bin ich gespannt.

Casetti · 25. Oktober 2023

Smai-Lee schrieb:
Das Scifi Zeug

finde ich auch zum teil gut. ich muss dabei aber auch an so freaks wie Roger Dean , Syd Mead oder H.R. Giger denken, die ihre auftragsarbeiten noch händisch gefertigt haben - in stunden- oder tagelanger arbeitszeit.

hr-giger-sculpture-statue-alien-outside-museum-chateau-st-germain-th-medieval-city-la-gruyere-...jpg

Casetti · 28. Oktober 2023

Smai-Lee schrieb:
Arbeitszeit

ist auch für mich kein kriterium für ein zufriedenstellendes kunstwerk, wohl aber für die meisten klienten von werbern und grafikern.

schade, dass du die arbeiten im Giger-stil nicht mehr hast.

einseinsnull · 29. Oktober 2023

kann uns jemand mal diese stile in dem stile menu bei kandinski in deutsch oder englisch übersetzen - oder als kyrillischen text hier hinein kopieren?

Может ли кто-нибудь перевести эти стили в меню стилей в Кандински на немецкий или английский язык или скопировать их сюда как кириллический текст?

mit browser übersetzungstools kommt man an menus und formulare nicht heran und im html finde ich es auch nicht.

Scenturio · 29. Oktober 2023

einseinsnull schrieb:
kann uns jemand mal diese stile in dem stile menu bei kandinski in deutsch oder englisch übersetzen - oder als kyrillischen text hier hinein kopieren?

sind das vielleicht die selben wie hier? https://rudalle.ru/kandinsky22/image

oben rechts kannst du bei rudalle.ru die Sprache umschalten.

Ansonsten kann man sie nach und nach anklicken, und über "Element untersuchen" den Input-Value auslesen. Ist natürlich schon etwas umständlich.

einseinsnull · 29. Oktober 2023

Scenturio schrieb:
oben rechts kannst du bei rudalle.ru die Sprache umschalten.

ja das muss einem doch gesagt werden!

...wozu hab ich dich denn!

einseinsnull · 29. Oktober 2023

hab mich immer gewundert warum da EN steht wo es doch russisch ist. das ist also ein toggle mit 2 states, alles klar.

einseinsnull · 8. November 2023

Scenturio schrieb:
Ist natürlich schon etwas umständlich.

apropos umständlich, ich benutze inzwischen mouserecorder und scripte für das webinterface, dann ist das fast bequemer als mit dem telegram bot, trotz captcha.

die "styles" sind leider alles kinderkram, den ich für meine anwendung nicht brauche.

Area88 · 8. November 2023

Ich kann mir nicht helfen, aber grammatikalische Zusammenhänge zu erkennen und diese in "intelligenter" Weise kreativ bildlich umzusetzen, daran hapert es aber noch gewaltig:

gleicher Prompt:

und noch ein Ergebnis des gleichen Prompts:

Wer als erster den Prompt errät, hat gewonnen... ;-)

Scenturio · 8. November 2023

Area88 schrieb:
Wer als erster den Prompt errät, hat gewonnen

Putin und Selenskyj spielen Schach um Fisch?

einseinsnull · 8. November 2023

Area88 schrieb:
Wer als erster den Prompt errät, hat gewonnen...

das erwarte ich gar nicht mehr, dass das so funktioniert.

wenn man so denkt, übersieht man, dass das sprachmodell nicht mal die halbe miete ist.

bei der erstellung von prompts überlege ich mir immer zuerst welche begriffe und sätze das, was ich haben will, wohl bei einer google bilder suche benötigt würden um ein entsprechendes ergebnis zu bekommen - da ich vermutlich zurecht davon ausgehe, das die mehrheit der materials in den modellen aus dem web gescraped wurden und der html text in der nähe des bildes dabei mit berücksichtigt wird, als das denn klickarbeiter in fernost bilder verschlagworten und beschreiben.

beispiel:

man versucht ein gemälde von einem apfel neben einer birne zu erhalten und gibt "gemälde von einem apfel neben einer birne" ein.

sehr häufig erhält man nun als antwort fotos von 2 bildern nebeneinander, die wahlweise nur äpfel oder nur mangoananas zeigen.

warum? nun, ich vermute, dass es einfach sehr wenige bilder im netz gibt, die erstens überhaupt äpfel zeigen und zweitens auch nur sehr wenige webseiten, auf denen unter einem bild steht "dies ist ein bild, auf dem A neben B" zu sehen ist.

sehr häufig erhält man bei solcher verwendung von "A neben B" oder "A über B" auch eine antwort, die einfach in der mitte mit einem geraden strich geteilt ist und wieder 2 verschiedene dinge zeigt, die man als mensch natürlich als 2 unterschiedliche bilder rezipiert und interpretiert.

warum? nun, das gleiche spiel, es gibt einfach unheimlich viele solcher bilddateien im netz, die auch so aufgebaut sind. will sagen: sehr viel häufiger als andere, bei denen auch "A neben B" assoziiert ist.

außerdem scheint schon die sprach-interpretation anders zu sein als in chatbots - zumindesten was unsere wahrnehmung davon angeht.

in einem openAI basierten chatbot hast du die prompt (das ist das token) und nachdem der bot geantwortet hat, sendest du das nächste token. schon die erste antwort des bots befindet sich aber auf einer ganz anderen ebene, die man technisch den kontext nennt (nicht mit dem zu verwechseln, was man normalweise darunter versteht)

in einem chatbot ist der kontext die untere ebene und der wird von den token nur getriggert - und die komplexität des tokens bestimmt die größe des kontexts.

beispiel:

user:
kannst du mir eine zahl nennen?

bot:
17 ist z.b. eine zahl.
sie ist sehr schön, man kann sie mit einem stift auf papier schreiben.

user: noch eine?

bot:
29 ist z.b. eine zahl, genau wie 17 eine zahl ist.
sie ist sehr schön, man kann sie mit einem stift auf papier schreiben.

jetzt im vergleich dazu ein kleineres token, was zunächst zur gleichen antwort führen könnte:

user:
17

bot:
17 ist eine zahl.
sie ist sehr schön, man kann sie mit einem stift auf papier schreiben.

user: noch eine?

bot:
"noch eine" ist teil der deutschen sprache. die formulierung wird vor allem in bayern verwendet. ansonsten kann ich hier leider nicht weiterhelfen, denn ich bin nur ein spielzeug und du bist hier das produkt.

der bot hatte keine chance zu verstehen, dass wir noch eine zahl haben wollten, weil schon im ersten token von zahlen niemand etwas gesagt hat. "noch eine 17" hat er zwar verstanden, aber es schien ihm naheliegender zu sein zu reproduzieren, was bei wikipedia über das wort "noch" steht.

von einem bildgenerator hingegen erwartet man ja eigentlich überhaupt nicht, dass er uns beispielhaft eine 17 malt, wenn ihn fragen, ob er eine zahl kennt. hier ist der kontext, der in den modellen enthalten ist, schon überhaupt keine sprache mehr, die sich auf die eingabe beziehen würde.

deswegen ergeben dort auch sehr ähnliche token oft komplett andere antworten, während es bei chatbots genau umgekehrt ist.

wenn du in dalli ruski gemälde graphik retro rotes haus unter dreidimensionalem laser im sturm eingibst und dann nur das "rot" in "grün" änderst oder auch nur noch "17" dahinterschreibst, erhälst du als antwort schon etwas vollkommen anderes, z.b. ein aquarell von einem haus im sturm aber ohne laser statt einem foto von einem laser in einem haus aber ohne sturm.

du kannst es also bei diesem (nicht bei allen) bildgenrator komplett vergessen, einfach englisch oder deutsch mit ihm zu kommunizieren. stattdessen musst du versuchen, dich seinem kontext und seinen modellen anzunähern.

elabtronx · 8. November 2023

Area88 schrieb:
Wer als erster den Prompt errät, hat gewonnen...

2 rostig rüstige Russen, zb Rasputin und Romanow, davon einer mit rotem Bart, spielen um Rotbarsch Reste auf Arsch sitzend eine Runde Schach.

Area88 · 8. November 2023

Gute Vorschläge, aber mein Prompt lautete:

"Schubiduh und Schabadah spielen gemeinsam Schach an einem Tisch, der aus verrosteten Salzheringen gedengelt wurde."

Es ist zwar irgendwie umgesetzt, wobei die schachspielenden Fantasiefiguren ja noch am ehesten dem Prompt entsprechen, aber der Rost sollte sich eigentlich ausschließlich auf den Salzheringen abspielen, aus denen der Tisch gedengelt sein sollte. Es hätte also ein aus plattgehauenen, rostigen Salzheringen bestehender Tisch (zumindest die Tischplatte) zu sehen sein müssen. Stattdessen friemelt die KI den Rost an die Wände oder an die Figuren.

Da wird doch deutlich, dass die KI grammatikalische Zusammenhänge überhaupt nicht kapiert und einfach die im Prompt vorkommenden Substantive, Verben, Adjektive usw. aufgreift und daraus irgendetwas "komponiert", also im wortwörtlichsten Sinn zusammenfügt, ohne dabei auf semantische Korrektheit zu achten.

Aber vielleicht ist es genau diese Unzulänglichkeit, die diese teils absurden, teils lustigen Ergebnisse generiert.

Schön wäre es, wenn man die Umsetzung tiefergehend - was korrekte Semantik angeht - parametrieren könnte...

Neueste KI zur Bilderzeugung

||||

||||

||||

|||||

darsho

Sö Sünteßeisör !

Anhänge

darsho

Sö Sünteßeisör !

Casetti

|||||||||||

darsho

Sö Sünteßeisör !

Casetti

|||||||||||

Casetti

|||||||||||

noisemaker

darsho

Sö Sünteßeisör !

Anhänge

darsho

Sö Sünteßeisör !

elabtronx

||||||||||

||||||||||||

[nur noch PN]

[nur noch PN]

[nur noch PN]

Casetti

|||||||||||

Casetti

|||||||||||

[nur noch PN]

au͘͏͡d̛̀i̛͝a͞ţ͏u͏r ̷͜et ̶͟͝a͡l͜t͢͡͠e͜͠ŗa ͝p͢a̛rs

[nur noch PN]

[nur noch PN]

[nur noch PN]

||||||||||||

au͘͏͡d̛̀i̛͝a͞ţ͏u͏r ̷͜et ̶͟͝a͡l͜t͢͡͠e͜͠ŗa ͝p͢a̛rs

[nur noch PN]

elabtronx

||||||||||

||||||||||||

Similar threads