Audiobook vs audioserial – czym się różnią i który format wybrać?
Bartosz Sroczyński
Bartosz Sroczyński
Rynek audiobooków i ebooków w Polsce osiągnął 600–700 mln PLN na koniec 2023 roku (dane PMR). Na Empik Go audiobooki stanowiły w 2024 roku 51% konsumowanych treści – po raz pierwszy wyprzedzając ebooki. W Europie audiobooki to wciąż 3,2% sprzedaży książek (FEP), ale dynamika wzrostu jest dwucyfrowa.
Dla wydawnictw, platform audio i autorów self-publishing oznacza to jedno: audio przestało być dodatkiem. To osobny kanał dystrybucji z własnymi regułami, kosztami i wymaganiami technicznymi.
Pytanie nie brzmi już „czy wydawać audio”, tylko w jakim formacie – audiobook czy audioserial (słuchowisko)?
Audiobook to nagranie tekstu książki odczytanego przez lektora. Jeden głos, linearna struktura, brak efektów dźwiękowych. Brzmi prosto – ale produkcja dobrego audiobooka ma swoje pułapki.
Audioserial to zupełnie inna liga produkcyjna. Wielogłosowa obsada, dialogi, efekty dźwiękowe, muzyka, sound design – to bardziej produkcja filmowa niż nagranie lektora.
W Polsce ten format najlepiej rozwinęła Audioteka, która ma w katalogu ponad 200 superprodukcji – wielogłosowych słuchowisk z pełnym sound designem, reżyserią i obsadą aktorską. Przykład skali: „Upadek gigantów” Kena Folletta to ponad 40 godzin gotowego materiału w 16 odcinkach, dziesiątki aktorów i 7 miesięcy produkcji.
To jest temat, który najczęściej pojawia się w rozmowach z wydawcami. Ile to naprawdę kosztuje?
| Element | Tradycyjnie (PLN) | Z AI voice cloning (PLN) |
|---|---|---|
| Lektor / narrator | 500–600+ / godz. gotowego materiału | Wliczone w produkcję |
| Nagranie w studio | 200–400 / godz. sesji | Nie dotyczy |
| Montaż i mastering | 100–250 / godz. materiału | Wliczone w produkcję |
| Korekta (poprawki) | Kolejna sesja nagraniowa | Natychmiastowa regeneracja |
| 10-godzinny audiobook | 8 000–12 000+ PLN | od 2 000 PLN |
Stawki lektorów to realne dane rynkowe – od 500 PLN/h gotowego materiału (czystylektor.pl) do 600+ PLN/h z produkcją (lektoring.pl). Do tego dochodzi wynajem studia nagraniowego, montaż i mastering.
W modelu AI voice cloning cały proces wygląda inaczej. Lektor nagrywa 30–60 minut próbki referencyjnej, na jej podstawie powstaje klon głosu (technologia ElevenLabs), a narracja jest generowana z kontrolą intonacji i tempa. Poprawki nie wymagają kolejnej sesji – wystarczy regeneracja fragmentu.
Tu koszty rosną znacząco, bo rośnie złożoność:
| Element | Koszt (PLN) |
|---|---|
| Adaptacja scenariusza | 1 000–5 000 / odcinek |
| Obsada aktorska (nagranie) | 1 500–5 000+ / odcinek |
| Sound design i foley | 1 000–4 000 / odcinek |
| Muzyka (oryginalna) | 1 500–5 000+ / odcinek |
| Miks i mastering | 500–2 000 / odcinek |
| Reżyseria | 1 000–3 000 / odcinek |
| 1 odcinek (30 min) | 6 500–24 000+ PLN |
Superprodukcje Audioteki to wielomiesięczne projekty z budżetami liczonymi w setkach tysięcy złotych. Ale nie każdy audioserial musi być superprodukcją.
W falami.studio produkujemy audioseriale z wykorzystaniem klonów głosowych – każda postać ma osobny głos z unikalną barwą. To pozwala na:
Cennik: audioserial z pełną produkcją od 2 000 PLN / godz. gotowego materiału (PFH – per finished hour).
Czas realizacji: 5–7 dni roboczych (Audiobook Express).
Czas realizacji: od 2–3 tygodni (z AI voice cloning) do kilku miesięcy (pełna produkcja z aktorami).
Wybór formatu wpływa na to, gdzie możesz dystrybuować:
| Platforma | Audiobooki | Audioseriale | Udział w rynku |
|---|---|---|---|
| Legimi | ✓ | – | ~21% |
| Empik Go | ✓ | ✓ | ~12% |
| Storytel | ✓ | ✓ | ~7,5% |
| BookBeat | ✓ | – | ~7,5% |
| Audioteka | ✓ | ✓ (superprodukcje) | ~7,5% |
Audioteka ma ponad 40 000 tytułów i jest jedyną polską platformą, która aktywnie inwestuje w superprodukcje słuchowiskowe. Storytel oferuje ok. 500 000 tytułów wielojęzycznie, BookBeat – ponad milion.
Każda platforma ma własne wymagania techniczne – format plików, loudness, metadane, struktura tagów rozdziałowych. Mastering pod konkretną platformę to osobny etap produkcji.
Jesteśmy studiem postprodukcji audio z 20-letnim doświadczeniem. Nie mamy własnego studia nagraniowego – specjalizujemy się w cyfrowej aranżacji audio, montażu, sound designie i masteringu. Gdy projekt wymaga nagrania z żywymi aktorami, pośredniczymy w wynajmie studia nagraniowego.
Korzystamy z technologii ElevenLabs do voice cloningu, co pozwala nam produkować audiobooki i audioseriale szybciej i taniej niż w modelu tradycyjnym. Jakości pilnujemy tak samo jak przy produkcji klasycznej – każdy projekt przechodzi korektę z transkrypcją porównawczą i mastering pod wymagania platformy.
Cennik:
Nie wiesz, który format wybrać? Napisz do nas – przeanalizujemy tekst i zaproponujemy format, który ma sens dla Twojego projektu i budżetu.
Powiązane usługi
Praktyczny przegląd narzędzi AI w produkcji audio – klonowanie głosu, automatyczna transkrypcja, inteligentne miksowanie i automatyzacja workflow.
Agent AI umawiający sesje, automatyczne follow-upy i wyceny w kilka minut – konkretne rozwiązania z naszego studia, które oszczędzają godziny tygodniowo.
Jak dodać automatyczny player audio do artykułów na WordPressie z ElevenLabs Audio Native. Konfiguracja przez WPCode, rozwiązanie problemu z podpisami zdjęć i realne koszty.