KI Bilder mit einem Synthesizer

Ich finde es immer noch sehr interessant, dass man sehr einfach und deutlich an den falsch angeordneten schwarzen Tasten erkennt, dass es ein KI-erzeugtes Bild ist. Wann werden die KIs es lernen? Ist es sooo schwer es beizubringen? Oder hat sich einfach noch keiner die Arbeit gemacht es zu trainieren?
Roboter halt...

Bildschirmfoto 2025-01-05 um 23.43.16.png
 
Habe jetzt sehr, sehr lange mit meinem wiederkehrenden Kommentar gewartet. Aber bis heute konnte mir Niemand erklären, warum keine KI dieses sehr simple, wiederholende Muster der schwarzen Tasten eines Keyboards nicht kapiert (2,3,2,3,2,..). Das soll keine Kritik oder Nörgelei sein - Ich fände die technische (algorithmische?)Hürde dahinter einfach sehr interessant.
 
Weil die Bild generierende K.I. keine Ahnung vom Keyboard spielen hat, das wahrscheinlich erst besser wenn div. K.I.s aus unterschiedlichen Bereichen zusammenarbeiten.
 
Weil die Bild generierende K.I. keine Ahnung vom Keyboard spielen hat, das wahrscheinlich erst besser wenn div. K.I.s aus unterschiedlichen Bereichen zusammenarbeiten.
Sorry, das ist viel zu oberflächlich. Das hat ja erstmal überhaupt nix mit Keyboard-“Spielen” oder Musikverständnis zu tun. Es geht um ein einfaches wiederholendes Tastenmuster. Deine Antwort erklärt gar nix. Gibt es hier hier keinen Fachmann, der sich mit den Algorithmen/Datenmodellen/KI-Trainingsmethoden auskennt?
 
Das ist eben kein einfaches und gleichmäßiges Muster beim Keyboard, schon wegen den großen und kleinen Tasten, üblicherweise sind die meisten Menschen bei der Musterkennung deutlich nachlässiger, außer das Muster hat eine bestimmte Funktion.
 
Das ist eben kein einfaches und gleichmäßiges Muster beim Keyboard, schon wegen den großen und kleinen Tasten, üblicherweise sind die meisten Menschen bei der Musterkennung deutlich nachlässiger, außer das Muster hat eine bestimmte Funktion.
Sorry, aber das ist ein einfaches, gleichmäßiges Muster.
Ich habe Microsoft CoPilot (ChatGPT) gefragt und der erklärt mir “Die schwarzen Tasten sind die erhöhten Tasten, die in Gruppen von zwei und drei angeordnet sind.” . ChatGPT “weiß” also die Anordnung - scheinbar. Außerdem hat er mir nun nach mehreren Versuchen fast ein korrektes Symbolbild geliefert :
image.jpg

Die schwarzen Tasten müssen ja zwischen den Weißen sein.
Wir nähern uns 😀
 
Nee, er kapiert es nicht:
image.jpg

Und anscheinend kann er es nach mehreren Erklärungen nicht darstellen. Immer wieder falsch im Foto. Wahrscheinlich ist dieser Weg, es der KI “beizubringen” nicht möglich.
Aber immerhin habe ich den Copilot nun veranlasst, ein Feedback an die Entwickler zu geben. Also falls es in den nächsten Tagen funktioniert: Nichts zu danken 😂
image.jpg
 
Zuletzt bearbeitet:
Sorry, aber das ist ein einfaches, gleichmäßiges Muster.
Schau dir die Bilder genauer an, auch andere Muster sind nur angedeutet, es fällt uns einfach nicht auf und ich glaub irgendwie nicht das ChatGPT und der Bildgenerator mehr gemeinsam haben als das der eine für den anderen die Anweisungen der User interpretiert.
 
Schau dir die Bilder genauer an, auch andere Muster sind nur angedeutet, es fällt uns einfach nicht auf und ich glaub irgendwie nicht das ChatGPT und der Bildgenerator mehr gemeinsam haben als das der eine für den anderen die Anweisungen der User interpretiert.
Aber andere Muster funktionieren doch auch. Vieles wird korrekt dargestellt in Bildgeneratoren. Auch viele Muster. Ich bin sicher, es hat nur noch kein “KI-Trainer” auf diese spezielle Problem hingearbeitet. Mich würde halt interessieren, wie man sowas trainiert bzw. den Algorithmus gezielt anpasst. Ich bin sicher, da gibt es einen Weg. Im Laufe der Zeit werden die Generatoren ja immer naturgetreuer. Nur nicht in diesem speziellen Fall. Alles was Du sagst, a lá “geht halt nicht, weil es nicht geht”, hilft leider nicht weiter.
 
Sorry für meine Monologe. Ich habe mal versucht, von Copilot eine deutsche Tastatur darstellen zu lassen. Auch ziemlich weit daneben 🙂. Aber immerhin…
image.jpg

Ich sehe gerade: Der meistgenutzte Buchstabe “e” fehlt zum Beispiel 😀
 
Zuletzt bearbeitet:
Aber andere Muster funktionieren doch auch. Vieles wird korrekt dargestellt in Bildgeneratoren.
Dann musst du genauer hinschauen ;-) Knöpfe sehen komisch aus, schon mal nach Beschriftung der Parameter gesucht und wo sind die Wheels geblieben?
 
Habe jetzt sehr, sehr lange mit meinem wiederkehrenden Kommentar gewartet. Aber bis heute konnte mir Niemand erklären, warum keine KI dieses sehr simple, wiederholende Muster der schwarzen Tasten eines Keyboards nicht kapiert (2,3,2,3,2,..). Das soll keine Kritik oder Nörgelei sein - Ich fände die technische (algorithmische?)Hürde dahinter einfach sehr interessant.
Tatsächlich ist der Bereich der Bilderzeugung, der am ehesten als KI bezeichnet werden kann, lediglich der Teil, der Einzelbilder mehr oder weniger sinnvoll zusammenfügt und teilweise verfälscht. Zunächst wird ein Prompt ausgewertet, was jedem bekannt ist. Dann werden passende Bilder im Netz gesucht. Diese werden neuinterpretiert/modifiziert und zusammengefügt. Eine KI erkennt bei einem Keyboard viele weiße Tasten und etwas weniger schwarze Tasten, Die 2-3-Regel wäre eine KI im Stande zu erkennen, wenn Sie darauf getrimmt würde, was aber die ohnehin schon lange Zeit der Bilderstellung wahrscheinlich vervielfachen würde. Eine Klaviatur wäre dabei noch relativ einfach, aber es gibt so unendlich viele Dinge, die ähnliche Folgenregeln haben. Bis das so umgesetzt ist, dass das alles korrekt interpretiert wird und in annehmbarer Zeit erstellt werden kann, vergehen mit hoher Wahrscheinlichkeit noch mehrere Jahre.
 
Habe jetzt sehr, sehr lange mit meinem wiederkehrenden Kommentar gewartet. Aber bis heute konnte mir Niemand erklären, warum keine KI dieses sehr simple, wiederholende Muster der schwarzen Tasten eines Keyboards nicht kapiert (2,3,2,3,2,..). Das soll keine Kritik oder Nörgelei sein - Ich fände die technische (algorithmische?)Hürde dahinter einfach sehr interessant.
das ist auch bei anderen KI generierten Bildern von Musikinstrumenten so, z.B. bei Saiteninstrumenten wie Gitarren, Bässen, Violinen sind Saiten, Stimmwirbel, Bünde, Polepieces bei Pickups vergleichbaren Musterfehlern unterworfen, obwohl es auch da ganz simple, physikalisch begründete Regeln gäbe. Auch bei Blasinstrumenten wie Trompeten oder Tuben ist vor Allem die Abbildung der Ventilmimik selten brauchbar. Einzig Bläser ohne Ventile oder rein mit Klappen wie Posaunen, Hörner oder Saxophone kommen in die Nähe.

KI schaut sich ein Musikinstrument zur Zeit wie ein Vorschüler an, welcher selbst kein Instrument spielt, deshalb die Physik eines Instruments nicht erfassen kann, aber eins zeichnen soll. Dies widerspiegelt, wo die KI kognitiv zur Zeit bei dem Thema steht. Da maschinelles Lernen einleuchtenderweise unserem eigenen Lernprozess nachempfunden ist, kommt Zeit, kommt der Lernprozess und vor allem hier auch wichtig: vernetztes Lernen und Denken. Irgendwann wird die KI soweit sein und dies und vieles Andere können.

Ob mir allerdings die Aussicht Freude bereiten soll, weiss ich nicht.
 
Zuletzt bearbeitet:


Neueste Beiträge

News

Zurück
Oben