Ако сте любител на Apple Books, има нова функция, която може да ви заинтересува или ужаси: Apple обяви стартирането на нов проект за цифрово разказване за създаване на аудиокниги с помощта на AI. Тъй като пазарът на аудиокниги експлодира в популярност, но само малка част от книгите всъщност се конвертират в аудио, новата технология на Apple предлага начин за премахване на „цената и сложността“, свързани със създаването на записи на човешки глас.
Първите публично достъпни резултати от проекта вече са в Apple Book Store. Ако отворите приложението Книги и потърсите „разказ с изкуствен интелект“, ще намерите няколко дузини художествени и романтични заглавия, обозначени като „Разказано от Apple Books“. Докоснете този етикет и ще бъдете информирани дали книгата ще ви бъде прочетена от „Медисън“, дигиталното сопрано, използвано за тези жанрове, или „Джаксън“, еквивалент на баритон. Твърди се, че и двете са базирани на истински човешки разказвач, но аудиото е генерирано с помощта на AI.
На уебсайта на Apple можете също да слушате семпли от „Хелена“ и „Мичъл“, които са дигиталните гласове за жанровете нехудожествена литература и саморазвитие, но те все още не са използвани за публично достъпни аудиокниги.
Apple ни уверява, че гласовете са резултат от „усъвършенствана технология за синтез на реч с важна работа на екипи от лингвисти, специалисти по контрол на качеството и аудио инженери“, но е ясно, че най-привлекателното качество на Мадисън и Джаксън е тяхната ефективност. Записването на човешки разказ отнема няколко седмици, потенциално струва хиляди долари и изисква присъствието на опитен гласов изпълнител или знаменитост (или все по-често автора), поради което толкова много книги остават само с текст. Подходът на AI значително увеличава рентабилността на процеса.
Но наистина ли е ефективно? Слушах първите няколко страници на Shelter From The Storm от Кристен Етридж и бях поразен колко нечовешко звучи. „Медисън“ не го прави доста звучи като човек и не може убедително да адаптира своите речеви модели към съдържанието на текста. Освен това го няма нематериалното човешко емоционално качество, което помага на слушателя да остане ангажиран. Постоянно се унасях, филтрирайки звука като фонов шум.
Технологията без съмнение се подобрява и може да е в състояние да замени човешките гласови актьори в рамките на няколко години, но все още не е там. Ясно е, че автоматизирането на процеса на разказване ще спести много пари в дългата опашка от бързо произведени книги с ниска аудитория, но също така е очевидно защо Apple е предпазлива при пускането на това за по-известни заглавия и при подчертаването на движи се като цяло. Доколкото ни е известно, не е имало стандартно съобщение за пресата за проекта и Apple изглежда насочва публичността си към авторите и издателите повече, отколкото към медийните сайтове или към широката публика.
И тези автори може да не са толкова запалени по идеята. Както отбелязва Guardian, това е стратегия, която трябва да се бори с критиките от много други заинтересовани страни, различни от читателите. Продуцент на аудиокниги и литературен агент, с които вестникът се свърза, говориха за стойността, осигурена от висококачествения разказ, и изразиха известна степен на скептицизъм относно проекта, но по-сериозни резерви може да дойдат от политически или юридически лица. С тази нова услуга Apple изглежда се насочва към създаването, а не просто към продажбата на аудиокниги, което ще отвори нов фронт за обвинения в антиконкурентно поведение.
Източник: www.macworld.com