Theoretisch müsste das gehen, aber wie konkret, kann ich Dir nicht sagen.
Ich habe mich vor einer Weile mal mit ffmpeg beschäftigt und dabei ist mir aufgefallen, dass das Cover-Bild als Video-Spur mit nur einem Frame eingebunden wird. Zumindest hat es den Anschein.
Was Du mit Deinen obigen Sätzen nun wirklich sagen wolltest habe ich nicht ganz verstanden. Du solltest mal an Artikulation und Interpunktion arbeiten.
Was ich verstanden habe ist, dass Du ein MP4-Video ohne Audiospur hast, und daraus das "Vorschau-Bild" extrahieren und in eine (andere?) MP3-Audio-Datei übernehmen willst. Das funktioniert sicherlich nicht ohne den Zwischenschritt, das Bild vorher als JPEG (oder anderes Bildformat) abzuspeichern und dann in das MP3 einzubinden.
Solltest Du jedoch gemeint haben, dass Du ein MP4-Video MIT Audiospur in ein MP3-Audio umwandeln willst, würde ich mal probieren, einfach alle anderen Frames außer dem ersten aus dem File zu löschen, bzw. nur das erste Frame mit zu übernehmen.
Allerdings muss man hier sagen, dass das Vorschau-Bild durch unterschiedliche Software/Betriebssysteme auch unterschiedlich ausgewählt wird. Manche Software zeigt das allererste Frame, andere wiederum nimmt irgendeins aus der Mitte, da zumindest bei normalen Filmen das erste Frame meist schwarz ist (wegen der Aufblendung).